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本 书 以 任务 驱动 的 方式 ， 带 领 读 者 编写 基于 LLVM 的 编译 器 前 端 、 
优化 器 、 后 端 。 通 过 丰富 的 实例 ， 读 者 能 够 从 中 理解 LLVM 的 架构 ， 以 
及 如 何 使 用 LLVM 来 编写 自己 的 编译 器 。 


相 比 于 传统 的 介绍 编译 技术 的 书籍 ， 此 书 更 偏 问 于 实战 ， 因 此 适合 
熟悉 编译 但 对 LLVM 比 较 陌 生 的 人 员 ， 也 适合 正在 学 习 编译 技术 并 且 在 
寻找 实战 机 会 的 人 员 。 


Ee Fe 


LLVM 这 个 名 字源 于 Lower Level Virtual Machine， 但 这 个 项 目 并 不 
局 限于 创建 一 个 虚拟 机 ， 它 已 经 友 展 成 为 当今 炙手可热 的 编译 器 基础 杠 
架 。LLVM 最 初 以 C/C++ 为 编译 目标 ， 近 年 来 经 过 众多 机 构 和 开源 社区 
的 努力 ，LLVM 己 经 能 够 为 ActionScript、D、Fortran、Haskell、Java、 
Objective-C、Swift、Python、Ruby、Rust、Scala 等 众多 语言 提供 编译 支 
持 ， 而 一 些 新 兴 语 言 则 直接 采用 了 LLVM 作 为 后 端 。 可 以 说 ，LLVM 对 
编译 器 领域 的 发 展 起 到 了 举足轻重 的 作用 。 


本 书 是 目前 为 数 不 多 的 介绍 LLVM 的 书籍 。 本 书 从 LLVM 的 构建 与 
安装 开始 说 起 ， 介 绍 了 LLVM 的 设计 思想 、LLVM 工 具 链 、 前 端 、 优 化 
器 、 后 端 ， 涵 盖 了 LLVM 的 绝 大 部 分 内 容 。 本 书 以 任务 驱动 的 方式 对 内 
容 进 行 介绍 ， 围 绕 着 实现 TOY 语 言 的 编译 器 ， 每 一 章节 都 会 带领 读者 编 
写 代 码 。 在 第 2 章 实现 了 编译 器 的 前 端 ， 第 4、5 章 逐步 实现 优化 器 ， 后 
面 的 章节 则 实现 了 编译 器 后 端 。 书 中 以 实践 的 方式 进行 讲述 ， 既 前 述 了 
原理 ， 又 让 读者 参与 到 编译 器 的 开发 当中 ， 这 一 方面 降低 了 学 习 LLVM 
的 门槛 ， 另 一 方面 也 让 读者 在 实践 中 理解 LLVM 的 细节 。 


作为 译 者 ， 我 党 得 能 够 翻译 此 书 也 是 一 种 缘分 。 最 初 是 因为 一 次 偶 
然 的 机 会 ， 我 接触 了 一 些 上 自然 语言 处 理 的 内 容 ， 在 此 过 程 中 我 领悟 了 词 
法 分 析 和 语法 分 析 是 怎么 一 回 事 ; 之 后 凭借 着 目 己 先前 了 解 的 零 零 碎 伴 
的 知识 ， 在 没有 系统 学 习 过 编译 原理 的 情况 下 写 出 了 自己 的 第 一 个 解释 
器 《当然 它 很 不 完备 ) ; 接着 便 去 系统 学 习 编译 原理 ， 由 于 有 了 一 定 的 
实践 基础 ， 理 解 那些 概念 也 轻松 了 许多 ; 而 关于 这 本 书 的 翻译 ， 则 是 因 
为 在 豆 汰 上 看 到 了 一 位 豆 友 转 及 的 消息 ， 逆 联系 出 版 社 的 张 春 雨 老师 ; 
最 后 在 翻译 此 书 的 过 程 中 ， 也 收获 了 很 多 。 

所 以 在 这 里 要 感谢 珊 我 走 近 目 然 语言 处 理 的 那 位 朋友 ， 要 感谢 转发 
此 消息 的 那 位 豆 友 ， 还 要 感谢 博文 视点 的 张 春 雨 老师 。 人 生 充 满 了 机 经 
巧合 ， 我 很 幸运 能 够 遇见 你 们 。 


与 此 同时 ， 我 也 希望 此 书 能 够 揭 开 编译 喜 的 面纱 ， 能 够 让 国内 更 多 









































的 人 了 解 编 译 技术 。 


王 欢 明 
2015 年 8 月 
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就 是 把 人 类 可 读 的 高 级 语言 映射 到 机 器 执行 码 。 但 你 知道 这 里 面 发 生 了 
什么 吗 ? 编译 器 在 生成 优化 过 的 机 器 码 之 前 还 做 了 很 多 处 理工 作 ， 一 个 
好 的 编译 器 包含 了 很 多 复杂 的 算法 。 


这 本 书 介绍 了 编译 的 几 个 阶段 ;前端 处 理 、 代 码 优化 、 代 码 生 成 
等 。 为 了 将 这 个 复杂 的 过 程 简化 ，LLVM 使 用 了 模块 化 的 思想 ， 使 得 每 
一 个 编译 阶段 都 被 独立 出 来 ; LLVM 使 用 面向 对 象 的 C++ 语言 完成 ， 为 
编译 器 开发 人 员 提 供 了 易 用 而 丰富 的 编程 接口 和 API。 所 以 ，LLVM 可 
能 是 最 容易 学 习 的 编译 器 框架 了 。 


作为 作者 ， 我 们 认为 简单 的 解决 方案 往往 会 比 复 杂 的 解决 方案 更 加 
奏效 ; 通过 这 本 书 ， 我 们 将 会 了 解 许 多 编译 技术 ， 它 能 提升 你 的 能 力 ， 
让 你 了 解 编译 选项 ， 理 解 编译 过 程 。 


我 们 也 相信 ， 那 些 从 事 编译 器 开发 的 程序 员 会 从 本 书 收益 民 多 ， 因 
为 对 编译 器 技术 的 了 解 会 帮助 他 们 写 出 更 好 的 代码 。 


我 们 希望 你 能 辟 欢 这 本 书 ， 宇 受 这 本 书 提 供 的 技术 盛 误 ， 也 能 开发 
目 己 的 编译 器 。 迫 不 及 竺 了 吗 ? 让 我 们 开始 吧 。 


本 书 概 述 
le: LLVM 设 计 与 使 用 。 本 章 介 绍 了 模块 化 的 LLVM 基 础 架构 设 


计 ， 让 你 学 会 如 何 下 载 安 装 LLVM 和 Clang， 通 过 一 些 例子 来 了 解 如 何 
使 用 LLVM 工 作 ， 也 会 介绍 一 些 其 他 的 编译 器 前 端 。 


第 2 章 : 实现 编译 器 前 端 。 本 章 介绍 了 如 何 为 一 门 编程 语言 编写 一 
个 编译 器 前 端 ， 我 们 通过 为 一 门 玩具 语言 写 一 个 玩具 编译 器 ， 来 了 解 如 
何 把 前 端 语言 映射 到 LLVM IR. 











第 3 章 : PA MI IIT. Ae ARTA an He 
现代 语言 的 高 级 特性 ， 以 及 对 前 端的 JIT 支 持 。 


第 4 章 : 准备 优化 。 本 章 介 绍 LLVM IR 的 Pass 结 构 ， 以 及 不 同 的 优 
化 级 别 和 每 一 级 别 上 的 优化 技术 。 我 们 也 将 看 到 如 何 一 步 一 步 编写 自己 
的 LLVM Pass。 


第 5 章 : 实现 优化 。 本 章 介 绍 如 何在 LLVM IR 上 实施 诸多 优化 
Pass， 以 及 在 LLYM 开 源 代 码 上 实现 一 些 向 量化 技术 。 


第 6 章 : 平台 无 关 代 码 生成 器 。 本 章 介 绍 了 一 个 平台 无 关 代 码 生 成 
器 的 抽象 结构 ， 如 何 把 LLVM IR 转换 到 有 向 无 环 图 (DAG) ， 以 及 如 
何 进一步 生成 目标 平台 机 器 码 。 


第 7 章 : 机 器 码 优 化 。 本 章 介 绍 了 DAG 的 优化 过 程 ， 目 标 寄存 器 分 
还 介绍 了 Selection DAG 上 的 各 种 优化 技术 及 不 同 寄 存 器 的 分 配 


第 8 章 : 实现 LLVM 后 端 。 本 章 介 绍 了 目标 架构 ， 包 括 寄 存 器 、 指 
令 集 、 调 用 约定 、 编 码 、 子 平台 特性 等 。 


第 9 章 : LLVM 项 目 最 佳 实践 。 本 章 介 绍 了 一 些 使 用 LLVM IRAR 
码 分 析 的 其 他 项 目 。 需 要 记 住 的 是 ，LLVM 不 仅仅 是 一 个 编译 器 ， 而 且 
是 一 个 编译 需 框 淋 。 本 章 介绍 了 一 段 可 应 用 到 各 种 项 目的 代码 ， 可 从 中 
获取 有 用 信息 。 
阅读 背景 

你 只 需要 一 台 Linux 计 算 机 ， 最 好 是 Ubuntu 系 统 ， 束 能 完成 本 书 的 
大 部 分 例子 。 你 也 需要 一 个 简单 的 文本 或 代码 编辑 嚣 、 网 络 连接 ， 以 及 
一 个 浏 宽 器 。 我 们 建议 安装 两 个 文件 的 合并 包 ， 它 在 大 部 分 Linux 平 台 
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都 能 运行 。 
RENZ 


本 书 适合 那些 熟悉 编译 器 概念 并 且 想 理解 学 习 LLVM 的 程序 员 。 
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内 容 组 织 


在 此 书 中 你 会 频 楷 地 看 到 一 些 标题 ， 例 如 准备 工作 、 详 细 步 骤 、 工 
作 原 理 、 更 多 内 容 、 为 请 参阅 。 


为 了 更 好 地 呈现 本 书 内 容 ， 我 们 采用 了 如 下 的 组 织 方式 。 
准备 工作 
这 部 分 对 章节 做 了 概述 ， 并 且 描 述 了 如 何 配置 软件 及 其 他 工具 。 


证 








部 分 涵盖 了 前 一 部 分 的 详细 解释 。 





Um us d TG WW. 


这 部 分 涵盖 了 参考 资料 的 链接 。 














在 本 书 中 你 会 发 现 大 量 用 不 同 格式 展示 的 文字 ， 这 里 举例 说 明 它 们 
涵义。 


RARE, BRR A. HKA, LHZ, SEA. KAZ, 
URL、 用 户 输入 、Twitter 用 如 下 方式 展示 : “我 们 可 以 用 include 指 令 引 
入 其 他 的 上 下 文 。” 


代码 块 用 如 下 格式 : 


primary := identifier_expr : 
=numeric_expr 
:=paran_expr 


当 我 们 想 强 调 部 分 代码 块 时 ， 相 关 行 会 使 用 粗 体 : 


primary := identifier_expr 
:=numeric_expr 
:=paran_expr 


命令 行 输入 和 输出 用 如 下 格式 : 
$ cat testfile.11 
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括 对 话 框 或 沫 单 ， 会 这 样 显 示 :“ 单 击 下 一 步 将 进入 下 一 屏 ”。 








警告 或 者 重要 内 容 会 在 这 块 展示 


一 些 提示 和 技巧 。 


下 载 示 例 代 码 


你 可 以 从 http:Wwww.broadview.com.cn 下 载 所 有 已 购买 的 博文 视点 书 


籍 的 示例 代码 文件 。 
勘误 表 


虽然 我 们 已 经 尽力 谨慎 地 确保 内 容 的 准确 性 ， 但 错误 仍然 存在 。 如 
果 你 发 现 了 书 中 的 错误 ， 包 括 正 文 和 代码 中 的 错误 ， 请 告诉 我 们 ， 我 们 
会 非 党 感激。 这样， 你 不 仅 帮 助 了 其 他 读者 ， 也 帮助 我 们 改进 后 续 的 出 
版 。 如 及 现任 何 勘误 ， 可 以 在 博文 视点 网 站 相应 图 书 的 页 面 提交 勘误 信 
恩 。 一 旦 你 找到 的 错误 被 证 实 ， 你 提交 的 信息 就 会 被 接受 ， 我 们 的 网 站 
也 会 发 布 这 些 勘误 信息 。 你 可 以 随时 浏览 图 书页 面 ， 查 看 已 发 布 的 勘误 


El 4o 








第 1 音 LLVM 设 计 与 使 用 


本 章 涵 盖 以 下 话题 。 


。 模块 化 设计 

e 交叉 编译 Clang/LLVM 

。 将 C 源 码 转 换 为 LLVM 汇 编码 

e 将 LLVM IR 转 换 为 bitcode 

e 将 LLVM bitcode 转 换 为 目标 平台 汇编 码 
e 将 LLVM bitcode 转 回 为 LLVM 汇 编码 

e 转换 LLVM IR 

e 链接 LLVM bitcode 

e 执行 LLVM bitcode 

e 使 用 C 语 言 前 端 
e 使 用 GO 语言 前 端 
e 使 用 DragonEgg 











Clang 


概述 


本 节 介 绍 LLVM 的 设计 理念 ， 以 及 如 何 使 用 LLVM 提 供 的 诸多 工 
具 。 你 将 了 解 如 何 把 C 语 言 代 码 编译 为 LLVM IR (Intermediate 
Representation 一 一 中 间 码 〉 以 及 如 何 把 它 转 为 其 他 多 种 形式 。 你 也 会 看 
到 在 LLVM 的 源码 树 中 代码 是 如 何 组 织 的 ， 以 及 如 何 使 用 LLVM 自 己 编 
tj — ^h VERE c 





模块 化 设计 


与 其 他 编译 器 (例如 GNU Compiler Collection——GCC) 不 同 ， 
LLVM 的 设计 目标 是 成 为 一 系列 的 库 。 本 市 以 LLVM 优 化 器 
Coptimizer) 为 例 来 解释 这 个 概念 ， 因 为 它 的 设计 就 是 基于 库 的 。 它 多 
许 你 选择 各 个 Pass《〈 趟 ) 的 执行 顺序 ， 也 能 够 选择 执行 哪些 优化 Pass 
也 就 是 说 ， 有 一 些 优化 对 你 设计 的 系统 是 没有 帮助 的 ， 只 有 少数 优 
化 会 针对 你 的 系统 。 反 观 传统 的 编译 器 优化 器 ， 它 们 通常 是 由 大 量 高 度 
灯 合 的 代码 组 成 ， 很 难 拆 分 成 容易 理解 和 使 用 的 小 模块 。 而 在 LLVM 
中 ， 如 果 你 想 了 解 特定 的 优化 器 ， 是 不 需要 知道 整个 系统 是 如 何 工 作 
的 。 你 只 需 选 择 一 个 优化 器 并 使 用 它 ， 无 须 担 心 其 他 依赖 它 的 组 件 。 


在 我 们 开始 本 节 之 前 ， 我 们 需要 知道 一 点 关于 LLYM 汇 编码 的 知 
识 。LLVM 的 代码 有 3 种 表示 形式 : 内 存 编译 器 中 的 IR、 存 于 磁盘 的 
bitcode， 以 及 用 户 可 读 的 汇编 码 。LLVM IR 是 基于 静态 单 赋值 4 (Static 
Single ^ Assignment ——SSA) 的 ， 并 且 提 供 了 类 型 安全 性 、 底 层 操 作 
性 、 灵 活性 ， 因 此 能 够 清楚 表达 绝 大 多 数 高 级 语言 。 这 种 表示 形式 贯穿 
LLVM 编 译 的 各 个 阶段 。 事 实 上 ，LLVM 了 IR 致 力 于 成 为 一 种 足够 底层 的 
通用 IR， 只 有 这 样 ， 高 级 语言 的 诸多 特性 才能 够 得 以 实现 。 同 样 ， 
LLVM “IR 组 织 良 好 ， 也 具备 不 错 的 可 读 性 。 如 果 你 对 理解 本 节 提 到 的 
LLVM 汇 编码 有 任何 疑问 ， 请 参考 本 节 结 尾 的 “ 男 请 参阅 ”一 节 。 


SSA 于 1980 年 由 [BM 开始 研究 ， 由 于 它 的 一 些 良好 性 质 ， 之 后 在 编 
译 器 领域 得 到 广泛 应 用 ， 包 括 LLVM。 
准备 工作 

在 开始 之 前 ， 我 们 需要 在 本 机 安装 LLVM 工 具 链 ， 特 别 是 opt 工 具 。 


PES UR 
































我 们 将 在 同一 段 代 码 上 逐步 实施 两 个 不 同 的 优化 ， 来 观察 它们 分 别 
是 如 何 改变 代码 的 。 


1. 首先 ， 我 们 来 写 一 段 代 码 用 作 优 化 器 的 输入 ， 在 这 里 创建 
testfile.]l 文件 。 


$ cat testfile.ll 

define i32 Qtest1(i32 %A) ( 
«B = add 132 %A, 0 
ret 132 %B 

} 


define internal i32 Qtest(i32 %X, i32 %dead) { 
ret 132 %X 
} 


define i32 @caller() { 
%A = call i32 Qtest(132 123, 132 456) 
ret i32 %A 

} 





2. 现在 ， 使 用 opt 工 具 来 进行 一 个 优化 


指令 合并 。 
$ opt -S -instcombine testfile.11 -o output1.11 


3. 查看 输出 ， 看 看 instcombine 优 化 是 如 何 进行 的 : 


$ cat output1.11 
; ModuleID = 'testfile.11' 


define i32 Qtest1(i32 %A) { 
ret 132 %A 
} 


define internal i32 @test(i32 %X, i32 %dead) { 
ret 132 %X 
} 


define i32 @caller() { 
%A = call i32 @test(i32 123, i32 456) 
ret i32 %A 

} 


4. 使 用 opt 工 具 进行 无 用 参数 消除 Cdead-argument-elimination) 优 
化 : 


$ opt -S -deadargelim testfile.11 -o output2.11 


5. 查看 输出 ， 看 看 deadargelim 优 化 的 效果 如 何 : 


$ cat output2.11 
; ModuleID = testfile.11' 
define i32 @test1(i32 %A) { 
«B = add i32 %A, 0 
ret 132 XB 


define internal i32 Qtest(i32 %X) { 
ret 132 %X 


define i32 @caller() { 
%A = call i32 @test(i32 123) 
ret 132 %A 

} 


LIF 


在 前 面 的 代码 中 ， 我 们 可 以 看 到 ， 第 1 个 命令 运行 instcombine 
Pass， 会 将 指令 合并 ， 因 此 %B = add i32 96A, 0; ret i32 %B 被 优化 为 ret 
i32 %A， 并 且 没 有 改变 原来 的 代码 ， 而 是 产生 了 新 的 代码 。 


在 第 2 个 样 例 中 ， 运 行 deadargelim pass， 对 第 一 个 函数 没有 任何 影 
啊 ， 但 优化 对 第 2 个 函数 有 所 影响 前 一 次 优化 中 没有 修改 的 部 分 代 
码 在 本 次 优化 中 被 改变 ， 无 用 的 参数 被 消除 了 。 


LLVM 优 化 器 为 用 户 提 供 了 不 同 的 优化 Pass， 但 整体 的 编写 风格 一 
致 。 对 每 个 Pass 的 源码 编译 ， 得 到 一 个 Object 文件 ， 之 后 这 些 不 同 的 文 
件 再 链接 得 到 一 个 库 。Pass 之 间 耦 合 很 小 ， 而 Pass 之 间 的 依赖 信息 由 
LLVM Pass 管理 器 (PassManager) 来 统一 管理 ， 在 Pass 运 行 的 时 候 会 














BEST AR DT. RIA A eas f 8E Passin t E EX BF E Je AE HJ 
Object 文 件 。 图 中 ，PassA 中 PassA.0 引 用 了 LLVMPasses.a， 而 自 定 义 的 
Pass 中 MyPass.o Object 文 件 引 用 了 不 同 的 库 MyPasses.a。 


下 载 样 例 代 码 


你 可 以 从 http://www.broadview.com.cn 为 你 购买 的 博文 视点 图 书 
下 载 示 例 代 码 ， 按 提示 注册 后 ， 找 到 本 书页 面 即 可 开始 下 载 。 


更 多 内 容 


与 优化 器 相似 ，LLVM 代 码 生 成 颖 (code generator) 也 采用 了 模块 
的 设计 理念 ， 它 将 代码 生成 问题 分 解 为 多 个 独立 Pass: 指令 选择 、 寄 存 
嚣 分配、 指令 调度 、 代 码 布局 优化 、 代 码 发 射 。 同 样 ， 也 有 许多 内 建 的 
Pass， 它 们 默认 执行 ， 但 用 户 可 以 选择 只 执行 其 中 一 部 分 。 
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。 在 接 下 来 的 章节 中 ， 我 们 会 看 到 如 何 编写 目 己 的 Pass， 并 且 能 够 选 
择 执行 哪些 优化 Pass 及 其 执行 顺序 。 如 条 想 详细 了 解 ， 请 参见 
http://www.aosa book.org /en/llvm.html 

e 关于 LLVM IR 的 更 多 信息 ， 请 参见 
http://Ilvm.org/docs/LangReg.html. 


交叉 编译 ClangLLVM 


所 谓 交 叉 编 译 ， 指 的 是 我 们 能 够 在 一 个 平台 《例如 x86) 编译 并 构 
建 二 进 制 文 件 ， 而 在 男 一 个 平台 (例如 ARM) 运行 。 编 译 二 进 制 文件 
的 机 器 称 为 主机 Chost) ， 而 运行 生成 的 二 进 制 文件 的 平台 我 们 称 为 目 
标 平 台 Carget) 。 为 相同 平台 “主机 与 目标 机 器 相同 〉 编 译 代码 我 们 
称 为 本 机 编译 (native assembler) ， 而 当主 机 与 目标 机 器 为 不 同 平台 
时 编译 代码 则 称 为 交叉 编译 (cross-compiler) 。 

本 市 将 展示 LLVM 交 叉 编 译 的 技术 ， 你 可 以 为 与 主机 平台 不 同 的 平 
台 编 译 LLVM， 因 此 你 能 够 在 所 需 的 特定 目标 平台 使 用 构建 的 二 进 制 文 
件 。 在 这 里 ， 交 叉 编译 将 通过 在 x86_64 主 机 平台 为 ARM 目 标 平 台 编 译 
LLVM 来 展示 ， 编 译 出 的 可 执行 文件 能 够 在 ARM 架 构 的 平台 上 执行 。 


准备 工作 


在 此 之 前 你 需要 为 系统 《主机 平台 ) 安装 以 下 包 《 程 序 ) : 











cmake 

ninja-build (来 自 Ubuntu 的 backport) 
gcc-4.x-arm-linux-gnueabihf 

gcc-4.x-multilib-arm-linux-gnueabihf binutils-arm-linux-gnueabihf 
libgcc1-armhf-cross 

libsfgcc1-armhf-cross 

libstdc++6-armhf-cross 

libstdc++6-4.x-dev-armhf-cross 

install Ilvm on your host platform 


详细 步 又 


为 了 从 主机 架构 〈 这 里 是 X86_64 平 台 ) 为 ARM 目 标 平 台 编 译 代 
码 ， 你 需要 执行 以 下 步骤 。 


1. 使 用 以 下 cmake 参 数 调用 cmake， 构 建 LLVM: 








-DCMAKE CROSSCOMPILING-True 

-DCMAKE INSTALL PREFIX-« T H&tz: Hoe (np) > 
-DLLVM_TABLEGEN=< 己 安装 的 LLVM 工 具 链 目录 »2/11vm-tblgen 
-DCLANG_TABLEGEN=< 己 安装 的 LLVM 工 具 链 目录 >/clang-tblgen 

-DLLVM DEFAULT TARGET TRIPLE-arm-linux-gnueabihf 

-DLLVM TARGET ARCH-ARM 

-DLLVM TARGETS TO BUILD-ARM 

-DCMAKE CXX FLAGS-'-target armv7a-linux-gnueabihf -mcpu=cortex-a9 
-I/usr/arm-linux-gnueabihf/include/c*-*/4.x.x/arm-linux-gnueabihf/ 
-I/usr/arm-linux-gnueabihf/include/  -mfloat-abi-hard -ccc-gcc- 
name 

arm-linux-gnueabihf-gcc' 


2. 如 果 你 使 用 平台 上 自 带 的 编译 占 ， 运 行 : 





$ cmake -G Ninja<LLVM 源 码 目 录 >< 上 面 的 选项 > 


如 果 使 用 Clang 作 为 交叉 编译 器 ， 需 要 在 path 环 境 变量 中 包含 
Clang/Clang++: 


$ CC-'clang' CXX='clang++' cmake -G Ninja < 源码 目录 > < 上 面 的 选项 > 
3. 编译 LLVM， 简 单 类 型 : 

$ ninja 
4. 在 成 功 编译 LLVM/Clang 之 后 ， 只 需要 用 如 下 命令 安装 一 下 : 


$ ninja install 


如 果 你 指定 了 DCMAKE INSTALL PREFIX 参 数 ， 则 会 在 install-dir 
这 个 位 置 创建 sysroot2。 


CER 


cmake 包 用 来 构建 所 需 平 台 的 LLVM 工 具 链 ， 你 需要 为 其 指定 参 
数 ，tblgen 工 具 用 于 把 目标 平台 的 描述 文件 转换 成 C++ 代 码 ， 因 此 ， 通 
过 它 可 以 获得 目标 平台 的 相关 信息 一 一 比如 指令 集 、 寄 存 融 数量 等 。 











如 果 用 Clang 作 为 交叉 编译 器 ， 构 建 ARM 平 全 的 后 端 时 可 能 会 
出 现 一 个 问题 ， 即 在 地 址 无 关 代 人 码 (position-independent code 
PIC) 生成 过 程 中 的 绝对 地 址 重 定 癌 ， 这 时 候 可 以 关闭 PIC 作 
为 解决 方案 。 


在 主机 上 ， 由 于 架构 的 不 同 ， 是 无 法 使 用 ARM 平 台 的 库 的 ， 
所 以 你 可 以 下 载 一 份 ， 或 者 目 己 编译 构建 。 
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本 市 将 使 用 C 语 言 前 端 一 一 Clang， 把 C 语 言 源码 转换 为 LLVM IR. 


准备 工作 








1. 首先 在 multiply.c 文 件 中 编写 一 段 C 语 言 代 码 ， 如 下 : 


$ cat multiply.c 
int mult() { 

int a =5; 

int b = 3; 

int c =a * b; 
return c; 


} 
2. 使 用 以 下 命令 来 将 C 语 言 代 码 转 换 成 LLVM IR: 





$ clang -emit-llvm -S multiply.c -o multiply.11 


3. 生成 如 下 的 LLVM IR: 


$ cat multiply.11 

; ModuleID = 'multiply.c' 

target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128" 
target triple = "x86 64-unknown-linux-gnu" 


; Function Attrs: nounwind uwtable 
define i132 Qmult() #0 { 
%a = alloca i132, align 4 
%b = alloca i32, align 4 
%c = alloca i32, align 4 
store i32 5, i32* %a, align 4 
store i32 3, i32* %b, align 4 
%1 = load i32* %a, align 4 
%2 load i32* %b, align 4 
%3 mul nsw i32 %1, %2 
store i32 %3, i32* %c, align 4 
%4 = load i32* %c, align 4 
ret i32 %4 


或 者 通过 cc1 生 成 IR: 


$ clang -cc1 -emit-llvm testfile.c -0 testfile.ll 


LEER 


将 C 语 言 代码 编译 为 LLVM IR 的 过 程 从 词法 分 析 开 始 将 C 语 言 
源码 分 解 成 token 流 ， 每 个 token 可 表示 标识 符 、 字 面 量 、 运 算 符 等 ; 
token 流 会 传递 给 语法 分 析 器 ， 语 法 分 析 器 会 在 语言 的 CFG (Context 
Free Grammar， 上 下 文 无 关 文 法 ) 的 指导 下 将 token 流 组 织 成 AST( 抽 
象 语法 树 ) ; 接 下 来 会 进行 语义 分 析 ， 检 查 语义 正确 性 ， 然 后 生成 IR。 


这 里 我 们 使 用 Clang 前 端 来 将 C 代 码 转 为 IR 文 件 。 
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。 在 第 2 章 中 ， 我 们 将 会 看 到 词法 分 析 、 语 法 分 析 和 代码 生成 的 工作 
原理 。 关 于 LLVM IR 的 基本 信息 ， 请 参阅 
http://Ilvm.org/docs/LangRef.html. 





将 LLVM IR 转 换 为 bitcode 


本 节 将 介绍 如 何 从 LLVM IR 来 生成 bitcode。LLVM bitcode (也 称 为 
字 节 码 一 一 bytecode ) 由 两 部 分 组 成 : 位 流 (bitstream， 可 类 比 字 节 
流 ) ， 以 及 将 LLVM IR 编 码 成 位 流 的 编码 格式 。 


准备 工作 


你 需要 安装 llvm-as 工 具 ， 并 添加 到 PATH 环境 变量 中 。 


详细 步骤 
执行 以 下 步 又。 


1. 首先 创建 LLVM IR 代 码 作为 lvm-as 的 输入 : 


$ cat test.11 

define i132 @mult(i32 %a, i32 %b) #0 { 
%1 = mul nsw i32 %a, %b 
ret 132 %1 

} 


2. 执行 以 下 命令 把 test.]] 文 件 的 LLVM IR 转 为 bitcode 格 式 : 


llvm-as test.ll -o test.bc 


3.， 输 出 到 test.bc 文 件 ， 它 是 位 流 格 式 的 ， 由 于 它 是 二 进 制 的 ， 如 果 
我 们 直接 看 它 的 内 容 ， 会 发 现 : 


因为 它 是 bitcode 文 件 ， 所 以 会 看 到 一 堆 乱 码 。 查 看 它 的 内 容 的 最 好 
方式 是 使 用 hexdump 工 具 ， 下 和 面 的 截图 是 hexdump 的 输出 : 





CE RS 


llvm-as 即 是 LLVM 的 汇编 器 。 它 会 将 LLVM IR 转 为 bitcode WIE 
普通 的 汇编 码 转 成 可 执行 文件 ) 。 在 之 前 的 命令 中 ， 它 使 用 test.1 作 为 输 
入 ，test.bc 作 为 bitcode 输 出 文件 。 


更 多 内 容 


为 了 把 LLVM IR 转 为 bitcode， 我 们 引入 了 区 块 (block) 和 记录 
(record) 的 概念 。 区 块 表 示 位 流 的 区 域 ， 例 如 一 个 函数 体 、 符 号 表 
等 。 每 个 区 块 的 内 容 都 对 应 一 个 特定 的 ID， 例 如 LLVM IRF ek AID 
是 12。 记 录 由 一 个 记录 码 和 一 个 整数 值 组 成 ， 它 们 描述 了 在 指令 、 全 局 
变量 描述 符 、 类 型 描述 中 的 实体 。 


LLVM IR 的 bitcode 文 件 由 一 个 简单 的 封装 结构 封装 。 结 构 包 括 一 个 
描述 文件 段落 偏 移 量 的 简单 描述 头 ， 以 及 内 租 BC 文 件 的 大 小 。 


HWZ p] 





。 关于 LLVM 位 流 文件 格式 的 更 多 信息 ， 请 参阅 
http://llvm.org/docs/BitCodeFormat.html£abstract - 


将 LLVM bitcode 转 换 为 目标 平台 汇编 
14 
本 节 介 绍 如 何 将 LLVM bitcode 文 件 转换 为 目标 机 器 的 汇编 码 。 


准备 工作 


你 需要 安装 来 白 LLVM 工 具 链 的 LLVYM 静 态 编译 器 llc。 





详细 步骤 
执行 以 下 步骤。 


> 


1. 前 一 节 创 建 的 test.bc bitcode 文 件 可 作为 lc 的 输入 ， 通 过 以 下 命 
可 把 LLVM bitcode 转 换 为 汇编 码 : 


$ llc test.bc -o test.s 


2. 输出 到 test.s 汇 编 文 件 ， 可 通过 以 下 命令 碍 看 : 


$ cat test.s 

.text 

.file "test.bc" 

.globl mult 

.align 16, 0x90 

.type mult, @function 
mult: # @mult 
.cfi_startproc 

# BB#O: 

Pushq %rbp 

.Ltmpo: 
.cfi_def_cfa_offset 16 


.Ltmp1: 

.cfi offset %rbp, -16 
movq “rsp, %rbp 

.Ltmp2: 

.Cfi def cfa register %rbp 
imull %esi, %edi 

movl %edi, %eax 

popq %rbp 

retq 

.Ltmp3: 

.size mult, .Ltmp3-mult 
.cfi endproc 


B 或 者 通过 Clang 从 bitcode 文 件 格式 生成 汇编 码 ， 需 要 使 用 -S 参 
数 ， 得 到 test.s 汇 编 文 件 和 test.bc 位 流 格式 文件 : 





$ clang -S test.bc -o test.s -fomit-frame-pointer  # 使 用 Clang 前 端 


输出 的 test.s 文 件 和 之 前 样 例 的 一 样 。 另 外 ， 我 们 使 用 了 fomit-frame- 
pointer 参 数 ， 因 为 Clang 默 认 不 消除 帧 指针 而 lc 却 默认 消除 。 


CHER 


lic 命令 把 LLVM 输入 编译 为 特定 架构 的 汇编 语言 ， 如 果 我 们 在 之 前 
的 命令 中 没有 为 其 指定 任何 架构 ， 那 么 默认 生成 本 机 的 汇编 码 ， quae 
lc 命令 的 主机 。 如 果 你 想 更 进一步 由 汇编 文件 得 到 可 执行 文件 ， 你 还 
以 使 用 汇编 器 和 链接 器 。 


更 多 内容 


在 以 上 命令 中 加 入 -march=architechture 参 数 ， 可 以 生成 特定 目标 架 
构 的 汇编 码 。 使 用 -mcpu= cpu 人 参数 则 可 以 指定 其 CPU， 而 -reg alloc =basic 
/greedy/ fasVpbqp 则 可 以 指定 寄存 器 分 配 类 型 。 


将 LLVM bitcode 转 回 为 LLVM 江 编码 


本 节 介 绍 如 何 通过 反 汇 编 工 具 llvm-dis 把 LLVM bitcode 转 回 为 LLVM 
IR. 


准备 工作 
你 需要 安装 llvm-dis 工 具 。 


详细 步 又 


为 了 展示 如 何 将 bitcode 文 件 转 为 IR， 使 用 “将 LLVM IR 转 换 为 
bitcode” 那 一 节 得 到 的 test.bc 文 件 作 为 lvm-dis 工 具 的 输入 。 执 行 以 下 步 


又 。 


1. 执行 以 下 命令 把 bitcode 文 件 转换 为 我 们 之 前 创建 过 的 IR 文 件 : 


$ llvm-dis test.bc -o test.11 


2. 查看 其 生成 的 LLVM IR: 


| $ cat test.11 
; ModuleID = 'test.bc' 


define i132 @mult(i32 %a, i32 %b) #0 { 
%1 = mul nsw i32 %a, %b 
ret 132 %1 


输出 的 testJ1 文 件 和 我 们 之 前 在 “将 LLVM IRA S Zjbitcode" 35 — i 3: 
到 的 相同 。 


CER 


llvm-dis 命 令 即 是 LLVM 反 汇编 器 ， 它 使 用 LLVM bitcode 文 件 作为 输 
入 ， 输 出 LLVM IR. 


这 里 ， 输 入 文件 是 testbc， 通 过 llvm-dis 工 具 转 为 test.]。 
如 果 省 略 文件 名 ，llvm-dis 工 具 会 从 标准 输入 读 取 输入 。 


转换 LLVM IR 


本 节 介 绍 使 用 opt 工 具 把 IR 转 换 成 其 他 形式 ， 以 及 对 IR 代 码 实施 的 
多 个 优化 。 


准备 工作 
你 需要 先 安装 opt 工 具 
VEZ WR 


使 用 以 下 命令 用 opt 执 行 转换 Pass。 


$opt -passname input.11 -o output.11 


1. 来 看 一 个 真实 的 样 例 ， 我 们 采用 “将 C 源 码 编译 为 LLVM 汇 编 
码 ” 那 一 节 的 C 语 言 代 码 作 为 输入 ， 创 建 等 价 的 LLVM IR: 


$ cat multiply.c 
int mult() { 
int a =5; 


int b = 3; 

int c =a * b; 
return c; 

} 


2. 转化 成 IR 并 输出 内 容 ， 我 们 会 得 到 以 下 未 进行 优化 的 输出 : 


$ clang -emit-llvm -S multiply.c -o multiply.11 

$ cat multiply.11 

; ModuleID = 'multiply.c' 

target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128" 


target triple = "x86 64-unknown-linux-gnu" 


; Function Attrs: nounwind uwtable 
define i132 Qmult() #0 { 
%a = alloca i132, align 4 
%b alloca i32, align 4 
%c = alloca i32, align 4 
store i32 5, i32* %a, align 4 
store i32 3, i32* %b, align 4 
%1 = load i32* %a, align 4 
%2 = load i32* %b, align 4 
%3 = mul nsw i32 %1, %2 
store 132 %3, 132* %c, align 4 
%4 = load i32* %c, align 4 
ret 132 %4 


3. 现在 使 用 opt 工 具 进 行 一 个 转换 ， 优 化 内 存 访问 (将 局 部 变量 从 
内 存 提升 到 寄存 项 ) : 


$ opt -mem2reg -S multiply.ll -o multiply1.11 

$ cat multiply1.11 

; ModuleID = 'multiply.11' 

target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128" 
target triple - "x86 64-unknown-linux-gnu" 


; Function Attrs: nounwind uwtable 
define i132 @mult(i32 %a, i32 %b) #0 { 
%1 = mul nsw i32 %a, %b 
ret 132 %1 


} 
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opt 是 LLVM 的 优化 和 分 析 工 具 ， 采 用 input.]] 文 件 作 为 输入 ， 并 且 按 
照 passname 执 行 Pass。 在 执行 Pass 之 后 的 输出 存 于 output.]] 文 件 ， 其 中 包 
含 转换 后 的 了 豚 代 码 。opt 工 具 可 以 使 用 多 个 Pass。 


更 多 内 容 


析 ， 


如 果 给 opt 工 具 传 入 -analyze 参 数 ， 它 会 在 输入 源码 上 执行 不 同 的 分 
并 且 在 标准 输出 流 或 错误 流 打 印 分 析 结 果 。 当 然 ， 输 出 也 能 重 定 问 


到 为 一 个 程序 或 者 一 个 文件 。 


如 果 不 为 opt 工 具 传 入 -analyze 参 数 ， 它 会 对 输入 执行 转换 Pass， 以 


进行 优化 。 


外 ， 


下 面 列 出 了 一 些 重 要 的 转换 ， 可 作为 参数 传递 给 opt 工 具 : 


adce: 入 侵 式 无 用 代码 消除 。 
bb-vectorize: 基本 块 癌 量化 。 
constprop: 简单 常量 传播 。 

dce: 无 用 代码 消除 。 

deadargelim: 无 用 参数 消除 。 
globaldce: 无 用 全 局 变量 消除 。 
globalopt: 全 局 变量 优化 。 

gyn: 全 局 变量 编写 。 

inline: 函数 内 联 。 

instcombine: NRSA 

licm: 循环 常量 代码 外 提 。 
loop-unswitch: 循环 外 提 。 
loweratomic: 原子 内 建 函 数 ]owering。 
lowerinvoke: invode 指 令 lowering， 以 支持 不 稳定 的 代码 生成 器 。 
lowerswitch: switch 指 令 lowering。 
mem2reg: 内 存 访问 优化 。 
memcpyopt: MemCpy 优 化 。 
simplifycfg: 简化 CFG。 

sink: 代码 提升 。 

tailcallelim: 尾 调用 消除 。 


要 弄 明 白 这 些 优化 如 何 工 作 ， 你 最 好 至 少 运 行 一 些 之 前 的 Pass。 男 
如 果 想 要 得 到 这 些 Pass 可 应 用 的 合适 的 源码 ， 你 可 以 到 








llvm/test/Transforms 目 录 。 对 于 以 上 的 每 一 个 Pass， 在 那里 都 可 以 看 到 测 





试 代码 。 你 可 以 应 用 相关 Pass 并 查看 测试 代码 如 何 被 修改 。 


为 了 和 弄 明白 C 语 言 代 码 是 如 何 映 射 到 LLVM IR 的 ， 你 可 以 在 将 
C 代 码 转 换 为 IR 之 后 (在 “将 C 源 码 转 换 为 LLVM 汇 编码 ”一 节 提 
到 ) ， 运 行 mem2reg Pass， 它 会 帮助 你 明白 C 指 令 是 如 何 映射 到 IR 
BS AY 


链接 LLVM bitcode 


本 节 介 绍 如 何 把 之 前 生成 的 .bc 文件 变 成 一 个 单一 的 包含 了 所 有 所 需 
引用 的 bitcode 文 件 。 


准备 工作 


你 需要 移 安装 llvm-link 工 具 ， 用 它 来 链接 .bc 文件 。 


详细 步骤 
执行 以 下 步骤。 





1， 为 了 展示 llvm-link 的 功能 ， 首 移 在 不 同文 件 中 编写 两 段 代 码 ， 其 


$ cat test1.c 

int func(int a) { 
a = a*2; 

return a; 


} 

$ cat test2.c 
#include<stdio.h> 

extern int func(int a); 

int main() { 

int num = 5; 

num = func(num); 
printf("number is %d\n", num); 
return num; 


2. 使 用 以 下 命令 将 C 代 码 转 换 成 位 流 文件 格式 ， 先 转 成 1 文 件 ， 再 


将 .1 文件 转 成 .bc 文件 : 


$ clang -emit-llvm -S test1.c -0 test1.11 
$ clang -emit-llvm -S test2.c -0 test2.11 
$ llvm-as test1.11 -o testi.bc 
$ llvm-as test2.11 -o test2.bc 


我 们 得 到 了 test1.bc 和 test2.bc， 而 test2.bc 引 用 了 test1.bc 文 件 中 的 func 
Wik. 


3. 通过 如 下 方式 使 用 lvm-link 命 令 链 接 两 个 LLVM bitcode 文 件 : 


$ llvm-link test1.bc test2.bc -o output.bc 


我 们 给 llvm-link 工 具 提 供 了 多 个 bitcode 文 件 ， 并 链接 得 到 单个 
bitcode 输 出 文件 一 一 output.bc。 我 们 将 在 下 一 节 “ 执 行 LLVM bitcode” 运 
行 这 个 bitcode 文 件 。 
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llvm-linkM T. E. SARE Ae Se BE Beas 2: WIR ee a AE 
量 在 一 个 文件 中 被 引用 ， 却 在 男 一 个 文件 中 定义 ， 那 么 链接 器 就 会 解析 
这 个 文件 中 引用 的 符号 。 但 和 传统 的 链接 右 不 同 ，llvm-link 丰 会 链接 
Object 文 件 生成 一 个 二 进 制 文 件 ， 它 只 链接 bitcode 文 件 。 


在 前 面 的 场景 中 我 们 链接 test1.bc 和 test2.bc 文 件 生 成 output.bc 文 件 ， 
而 它 的 引用 已 经 被 解析 并 链接 了 。 








在 链接 bitcode 文 件 之 后 ， 我 们 可 以 传递 -参数 给 llvm-link 工 具 
来 输出 IR 文 件 。 


执行 LLVM bitcode 


本 节 介 绍 如 何 执 行 之 前 得 到 的 LLVM bitcode 文 件 。 
vp 
准备 工作 

你 需要 先 安 装 册 工具， 用 它 来 执行 LLVM bitcode. 


详细 步 又 


在 前 一 节 中 我 们 看 到 在 链接 两 个 .bc 文件 之 后 会 得 到 单个 的 位 流 文 
件 ， 其 中 一 个 文件 引用 了 为 一 个 文件 定义 的 func 函 数 。 而 调用 ji 命令 可 
以 执行 之 前 得 到 的 outpub.bc 文 件 ， 直 接 在 标准 输出 里 给 出 结果 : 


| $ 11i output.bc 
number is 10 


1 的 输入 是 output.bc 文 件 ， 它 会 执行 bitcode 文 件 ， 如 果 有 输出 会 在 
标准 输出 显示 结果 。 在 这 个 样 例 中 输出 结果 是 “humber is 10”， 这 就 是 由 
之 前 章节 中 的 test1l.c 和 test2.c 链 接 得 到 的 output.bc 文 件 的 执行 结果 。 
test2.c 文 件 的 主 函 数 调用 了 testl.c 文 件 的 func 函 数 ， 并 用 整数 5 作为 参 
数 ， 而 func 函 数 把 输入 参数 乘 以 2 之 后 返回 给 主 函 数 ， 主 函数 则 癌 标 准 
输出 打印 结果 。 


LEER 





lli 工 具 命 令 执行 LLVM bitcode 格 式 程序 ， 它 使 用 LLVM bitcode 格 式 
作为 输入 并 且 使 用 即时 编译 器 (JIT) 执行 。 当 然 ， 如 果 当 前 的 架构 不 
存在 JIT 编 译 器 ， 会 用 解释 器 执行 。 


如 采 王 能够 采用 JIT 编 译 器 ， 那 么 它 能 高 效 地 使 用 所 有 代码 生成 器 参 
数 ， Yuille. 





。 第 3 章 为 语言 增加 JIT 文 持 并 扩展 前 端 和 增加 JIT 文 持 部 分 。 





使 用 C 语 言 前 端 一 Clang 
本 节 将 展示 Clang 前 端的 不 同 用 途 

准备 工作 
你 需要 先 安装 Clang 工 具 

详细 步 又 


Clang 可 以 用 作 高 层 编 译 右 驱动 ， 让 我 们 来 看 一 个 样 例 。 
1. 创建 一 个 C 语 言 的 hello world， 文 件 名 是 test.c: 





$ cat test.c 
#include<stdio.h> 

int main() { 
printf("hello world\n"); 
return 0; } 


2. 使 用 Clang 作 为 编译 器 驱动 ， 编 译 得 到 可 执行 文件 aout， 执 行 即 
可 得 到 预期 结果 : 








$ clang test.c 
$ ./a.out 
hello world 


这 里 创建 了 C 语 言 文件 test.c， 我 们 用 Clang 编 译 之 后 就 得 到 可 执行 文 
件 ， 将 得 到 期 望 的 结果 。 


3. 除 此 之 外 ，Clang 也 能 用 作 预 处 理 器 ， 只 需要 增加 -E 参 数 。 下 面 
的 样 例 中 ，C 语 言 代 人 码 中 用 #define 定 义 了 一 个 宏 MAX， 其 值 为 100， 用 


来 作为 即将 创建 的 数组 的 长 度 : 


$ cat test.c 
#define MAX 100 
void func() { 
int a[MAX]; 

} 


4. 使 用 以 下 命令 调用 预 处 理 器 ， 在 标准 输出 中 输出 结果 : 


clang test.c -E 

1 "test.c" 

1 "<built-in>" 1 

1 "<built-in>" 3 
308 "<built-in>" 3 
1 "<command line>" 1 
1 "<built-in>" 2 

1 "test.c" 2 

void func() { 

int a[100]; 

} 


HHHHHHH OH 





在 test.c 文 件 中 ， 本 书 之 后 的 内 容 中 也 将 使 用 该 文件 ， 定 义 了 MAX 
为 100， 因 此 MAX 在 预 处 理 中 被 亚 换 之 后 ，a[MAX] 就 变 成 了 af[100]。 


5. 你 能 用 下 面 的 命令 打印 前 面 样 例 中 test.c 文 件 的 抽象 语法 树 ， 在 标 
准 输出 中 输出 结果 : 


| $ clang -cc1 test.c -ast-dump 
TranslationUnitDecl 0x3f72c50<<invalid sloc>><invalid sloc> 
|-TypedefDecl 0x3f73148««invalid sloc>><invalid sloc> implicit 
. int128 t ' int128' 
|- TypedefDecl 0x3f731a8««invalid sloc>><invalid sloc> implicit 
. uinti28 t 'unsigned _ int128' 
|- TypedefDecl 0x3f73518««invalid sloc>><invalid sloc> implicit 
. builtin va list ' va list tag [1]' 
^-FunctionDecl 0x3f735b8«test.c:3:1, line:5:1> line:3:6 func 
'void ()' 
~-CompoundStmt 0x3f73790«col:13, line:5:1> 
^-DeclStmt 0x3f73778<line:4:1, col:11> 
^-VarDecl 0x3f73718«col:1, col:10> col:5 a ‘int [100]' 














这 里 的 -ccl 参 数 保证 了 只 运行 编译 器 前 端 ， 而 不 是 编译 器 驱动 ， 它 
输出 了 test.c 文 件 代 码 的 AST。 


6. 你 也 可 以 用 下 面 的 命令 来 为 前 面 样 例 中 的 test.c 文 件 生成 LLVM 汇 
ai. 


I$ clang test.c -S -emit-llvm -o - 

|; ModuleID - 'test.c' 

|target datalayout = "e-m:e-i164:64-f80:128-n8:16:32:64-S128" 
|target triple - "x86 64-unknown-linux-gnu" 


|; Function Attrs: nounwind uwtable 
[define void @func() #0 ( 

|%a = alloca [100 x i32], align 16 
|ret void 


|} 
-S 参 数 和 -emit-llvm 参 数 保证 为 test.c 代 码 生 成 LLYM 汇 编码 。 


7. 为 了 得 到 用 于 相同 test.c 测 试 码 的 机 器 码 ， 需 要 给 Clang 传 递 -S 参 
数 。 如 果 你 使 用 了 -o -参数 ， 则 会 在 标准 输出 中 输出 结果 : 





$ clang -S test.c -0 - 


.text 
.file "test.c" 
.globl func 


| 

| 

| 

| 

| .align 16, 0x90 

| .type func, @function 
| func: # @func 
| .cfi startproc 

|# BB#0: 

| pushq %rbp 

| .Ltmpo: 

| .cfi def cfa offset 16 
| .Ltmp1: 

| .cfi offset %rbp, -16 
| movq %rsp, %rbp 

| .Ltmp2: 

| .cfi def cfa register %rbp 
| popq %rbp 

| retq 

| .Ltmp3: 

| „size func, .Ltmp3-func 


| .cfi endproc 


在 只 使 用 -S 参 数 的 情况 下 ， 编 译 占 会 在 代码 生成 的 过 程 中 产生 机 器 
E 这 里 使 用 了 -o -参数 ， 因 此 执行 命令 后 机 器 码 直 接 输 出 到 了 标准 输 
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FEZ HILAR BIH, ClangBE UP (eA Thies. Faas ko). Bim LA 
及 代码 生成 器 使 用 ， 因 此 它 的 输出 取决 于 你 指定 的 参数 。 
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e 这 里 简单 介绍 了 如 何 使 用 Clang， 而 还 有 很 多 参数 可 以 传递 给 
Clang， 对 应 了 不 同 的 功能 。 如 有 果 想 要 看 到 它 的 所 有 参数 ， 可 以 执 
行 clang 的 一 help 命 令 。 


MESA 4p uuu 
(EH GO A RU ing 
llgo 编 译 器 是 基于 LLVM 的 仅 用 Go 语言 写 的 Go 语言 前 端 ， 用 它 可 以 
把 Go 语言 程序 编译 成 LLVM 汇编 码 。 


准备 工作 


你 需要 下 载 llgo 二 进 制 文件 或 者 通过 源码 来 构建 lgo， 并 且 把 它 的 路 
径 添加 到 PATH 环境 变量 中 。 


详细 步骤 
执行 以 下 步骤。 


1. 创建 Go 源码 文件 ， 如 通过 llgo 生 成 LLVM 汇 编码 。 创 建 test.go: 


|$ cat test.go 

|package main 

|import "fmt" 

|func main() { 

| fmt.Println("Test Message") 


|} 
2. 然后 用 llgo 获 得 LLVM 汇 编码 : 


$11go -dump test.go 


; ModuleID = 'main' 
target datalayout = "e-p:64:64:64..." 
target triple = "x86 64-unknown-linux" 


%0 = type { i8*, i8* } 


CER 


lgo 编 译 器 是 Go 语言 的 前 端 ， 它 用 test.go 程 序 作 为 输入 ， 输 出 
LLVM IR. 


。 关于 llgo 的 源码 下 载 及 安装 步骤 ， 请 参见 https:/ github.com/go-llvm/ 
Ilgo. 


使 用 DragonEgg 


DragonEgg 是 一 个 GCC 插件 ， 它 使 得 GCC 能 够 使 用 LLVM 优 化 器 和 
代码 生成 器 来 取代 GCC 自己 的 优化 器 和 代码 生成 器 。 


准备 工作 


你 需要 GCC 4.5 及 以 上 版 本 ,目标 机 器 为 x86-32/x86-64 以 及 ARM 人 处 
理 右 。 当 然 ， 也 需要 下 载 DragonEgg 源 码 并 构建 dragonegg.so 动 态 链 接 库 
文件 。 


详细 步骤 
执行 以 下 步骤。 


1. 创建 一 个 简单 的 hello world 程 序 : 


$ cat testprog.c 
#include<stdio.h> 

int main() { 
printf("hello world"); 
} 


2. 用 GCC 来 编译 这 个 程序 ， 这 里 使 用 的 是 gcc-4.5: 


$ gcc testprog.c -S -01 -0 - 
.file" testprog.c" 
.section.rodata.stri.1,"aMS",@progbits,1 
.LCO0: 
.string"Hello world!" 
.text 
.globl main 


.type main, @function 
main: 

subq $8, %rsp 

movl $.LCO, %edi 

call puts 

movl $0, %eax 

addq $8, %rsp 

ret 

.Size main, .-main 


3， 在 gcc 命 令 行 中 使 用 -fplugin=path/dragonegg.so 参 数 ， 来 让 GCC 调 
用 LLVM 的 优化 器 和 代码 生成 器 : 


$ gcc testprog.c -S -01 -0 - -fplugin=./dragonegg.so 
.file " testprog.c" 
# Start of file scope inline assembly 
-ident "GCC: (GNU) 4.5.0 20090928 (experimental) LLVM: 
82450 :82981" 
# End of file scope inline assembly 


. text 
.align 16 
.globl main 
.type main, @function 
main: 
subq $8, %rsp 
movl $.L.str, %edi 
call puts 
xorl %eax, %eax 
addq $8, %rsp 
ret 
.Size main, .-main 
.type .L.str,@object 
.section 
.rodata.stri.1,"aMS",@progbits,1 
.L.str: 
.asciz "Hello world!" 
.size .L.str, 13 
.Section .note.GNU-stack,"",@progbits 


HWZ p] 


e 关于 DragonEgg 源 人 码 下 载 及 安装 ， 请 参见 http://dragonegg.llvm.org/。 





同 ] 在 编译 圳 的 设计 中 ， 静 态 单 赋值 形式 是 一 种 特殊 形式 的 中 间 码 
每 个 变量 仪 被 赋值 一 次 。 译 者 注 


[2]sysroot: 通常 指 的 是 系统 的 根 目 录 ， 例 如 Linux 系 统 的 根 目 录 
为 /。 有 时 我 们 可 以 通过 修改 sysroot 来 改变 程序 的 安装 路 入。 一 一 译 者 注 
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Qe ”实现 编译 右前 


本 章 涵 盖 以 下 话题 。 


定义 TOY 语 言 

实现 词法 分 析 器 

定义 抽象 语法 树 

实现 语法 分 析 器 

解析 简单 表达 式 

。 解析 二 元 表达 式 

。 为 解析 编写 驱动 

。 对 TOY 语 言 进行 词法 分 析 和 语法 分 析 
。 为 每 个 AST 类 定义 IR 代 码 生 成 方法 
e. 为 表达 式 生 成 IR 代 码 

e. 为 函数 生成 IR 代 人 码 

。 增加 IR 优 化 支持 


概述 


本 章 将 展示 如 何 为 一 门 语言 写 一 个 编 详 右 前 端 。 我 们 使 用 目 定义 的 
语言 TOY， 为 其 编写 词法 分 析 器 和 语法 分 析 器 ， 以 及 使 用 前 端 从 
AST (Abstract Syntax Tree) 生成 IR 代 码 。 


定义 TOY 语 言 


在 实现 词法 分 析 器 和 语法 分 析 器 之 前 ， 我 们 首先 需要 定义 这 门 语言 
的 语法 。 本 章 将 通过 TOY 语 言 来 展示 如 何 实现 词法 分 析 器 和 语法 分 析 
器 。 本 节 的 目的 是 展示 一 门 语言 的 基本 特性 。 出 于 这 个 目的 ，TOY 语 言 
比较 简单 但 具有 一 定 意 义 。 


通常 来 说 ， 一 门 编程 语言 会 有 一 些 变量 、 函 数 调 用 、 和 常量 等 。 为 了 
让 事情 简单 一 点 ， 我 们 考虑 实现 的 TOY 语 言 只 包含 32 位 的 整 型 常量 类 型 
A， 以 及 不 需要 声明 类 型 的 变量 〈 像 Python 一 样 ， 与 C/C++/Java 这 样 需 
要 类 型 声明 的 静态 语言 相反 ) 。 


详细 步 又 


语法 通过 如 下 的 推导 规则 来 定义 : 非 终 结 符 号 上 Cnonterminal- 
symbol) 在 左边 (Left Hand Side——LHS) ， 终 结 符号 2 (terminal- 
symbol) 和 非 终结 符 的 组 合 在 右边 〈Right Hand Side——RHS) ; iÈ 
到 一 个 LHS， 就 会 根据 推导 规则 生成 与 之 对 应 的 RHS 。 


1. 一 个 算术 表达 式 可 以 是 一 个 数字 第 量 : 






































numeric_expr := number 
2. 括号 表达 式 会 在 左右 括号 之 间 包 含 一 个 表达 式 : 
paran expr := '(' expression ')' 
3. 一 个 标识 符 (identifier〉 表 达 式 会 是 一 个 标识 符 或 者 函数 调用 : 


identifier_expr 
:= identifier 
:= identifier '('expr_list ')' 


中 


A 号 分 两 的 参数 列表 


expr_ list 
= (empty) 


:= expression (',' expression) * 
5. 另外 还 有 一 些 基本 表达 式 ， 它 们 可 以 是 标识 符 表 达 式 、 算 术 表达 
式 ， 或 者 括号 表达 式 ， 语 法 会 从 基本 表达 式 开 始 展 开 。 





primary := identifier_expr 
:-numeric expr 
:-paran expr 
6. 一 个 表达 式 可 以 是 一 个 二 元 表达 式 : 
expression := primary binoprhs 


7. 一 个 RHS 二 元 运算 则 是 二 元 运算 符 和 表达 式 的 组 合 : 








binoprhs := ( binoperator primary )* 
binoperators := '-«'/!-'/!*'!'/'/' 


8. 函数 声明 具有 如 下 的 语法 : 





func decl := identifier '(' identifier list ')' 
identifier list :- (empty) 
- (identifier)* 


9. 函数 定义 使 用 def 关 键 字 ， 其 后 是 函数 声明 和 定义 了 函数 体 的 表 
IAT: 
function_defn := 'def' func_decl expression 


10. 最 后 ， 需 要 一 个 顶层 的 表达 式 ， 以 生成 所 有 种 类 的 表达 式 : 


toplevel_expr := expression 

基于 以 上 定义 的 语法 ，TOY 语 言 可 以 写 出 这 样 一 个 样 例 : 
def foo (x , y) 
x ty * 16 


既然 我 们 已 经 定义 了 语法 ， 那 么 接 下 来 就 是 为 其 写 一 个 词法 分 析 顺 
Tisi) res 
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词法 分 析 往 往 是 编译 程序 的 第 一 步 。 词 法 分 析 器 把 程序 代码 的 输入 
流 切 分 成 token， 而 语法 分 析 右 则 接受 这 些 token 并 把 token 流 构建 成 
AST【〔 抽 象 语法 树 ) 。 通 常 来 说 ， 被 解析 成 token 的 语言 是 基于 上 下 文 无 
关 语 法 & 的 。 一 个 token 可 以 是 一 个 字符 串 ， 由 一 个 或 多 个 同一 范畴 的 字 
符 组 成 。 对 输入 字符 流 构建 成 token 的 过 程 称 为 符号 化 Ctokenization) 。 
为 了 把 输入 的 字符 分 组 成 token， 还 需要 有 特定 的 定 界 符 。 对 于 词法 分 
析 来 说 ， 有 自动 化 的 词法 分 析 工 具 来 完成 这 个 工作 ， 比 如 LEX。 而 我 们 
接 下 来 展示 的 TOY 词 法 分 析 右 ， 则 是 采用 C++ 语 言 来 手动 实现 的 。 


准备 工作 


我 们 必须 对 本 节 定 义 的 TOY 语 言 有 一 个 基本 的 了 解 。 首 先 创 建 一 个 
toy.cpp 文 件 : 

















$ vim toy.cpp 


接 下 来 的 代码 涵盖 了 词法 分 析 、 语 法 分 析 、 代 码 生 成 的 逻辑 。 


详细 步 又 


实现 词法 分 析 器 的 时 候 ， 需 要 确定 token 的 类 型 来 对 输入 字符 串 流 
进行 分 类 《与 目 动 机 中 的 状态 相似 ) ， 而 这 些 类 型 可 以 用 


enumeration (enum) 来 表示 。 


1. TTJFtoy.cpp X fF: 


$ vim toy.cpp 


2. 在 toy.cpp 文 件 中 编写 enum: 


enum Token_Type { 
EOF_TOKEN = 0, 
NUMERIC_TOKEN, 
IDENTIFIER_TOKEN, 
PARAN_TOKEN, 
DEF_TOKEN 


}; 
下 面 是 以 上 代码 的 术语 表 : 


EOF_TOKEN: 它 规定 文件 的 结束 。 
NUMERIC_TOKEN: 当前 token 是 数值 类 型 的 。 
IDENTIFIER_TOKEN: 当前 token 是 标识 符 。 

PARAN TOKEN: 当前 token 是 括号 。 

DEF TOKEN: 当前 token 是 def 声 明 ， 之 后 是 函数 定义 。 


3. 为 了 持 有 数值 ， 需 要 在 toy.cpp 文 件 中 定义 一 个 静态 变量 : 


static int Numeric_Val; 


4. 为 了 持 有 Identifier 字 符 串 名 字 ， 还 需要 在 toy.cpp 文 件 中 定义 一 个 
ze aie En 
静态 变量 : 


static std::string Identifier_string; 


B; 现在 通过 在 toy.cpp 文 件 中 使 用 一 些 诸如 isspaceO、isalpha0 和 
fgetcO 之 类 的 C 语 言 库 函 数 定义 词法 分 析 函 数 ， 如 下 : 


static int get_token() { 


static int LastChar = A 


while(isspace(LastChar)) 
LastChar - fgetc(file); 


if(isalpha(LastChar)) ( 
Identifier string - LastChar; 


while(isalnum((LastChar = fgetc(file)))) 
Identifier_string += LastChar; 


if(Identifier_string == "def") 
return DEF. TOKEN; 
return IDENTIFIER TOKEN; 


j 


if(isdigit(LastChar)) ( 
std::string NumStr; 
do { 
NumStr += LastChar; 
LastChar = fgetc(file); 
} while(isdigit(LastChar)); 


Nu meric_Val = strtod(NumStr.c_str(), 0); 
return NUMERIC TOKEN; 


} 

if(LastChar == '#') { 
do LastChar = fgetc(file); 
while(LastChar != EOF && LastChar != '\n' 
&& LastChar != '\r'); 


if(LastChar != EOF) return get_token(); 


if(LastChar == EOF) return EOF_TOKEN; 


int ThisChar = LastChar; 
LastChar = fgetc(file); 
return ThisChar; 


“CE RS 


之 前 定义 的 TOY 语 言 样 例如 下 : 


def foo (x , y) 
x+y * 16 


词法 分 析 器 会 以 这 个 程序 为 输入 。 在 遇 到 def 关 键 字 之 后 ， 判 断 出 


接 下 来 会 是 函数 定义 的 token， 因 此 返回 枚 举 值 DEF_ TOKEN。 然 后 会 遇 
到 函数 定义 以 及 参数 。 接 着 是 一 个 有 两 个 二 元 操作 符 、 两 个 变量 、 一 个 
R vMeM ER 
数据 ， 








e 关于 更 加 复杂 、 详 细 的 手写 C++ 词法 分 析 器 ， 可 以 参见 Clang 的 词法 
4y tas,» http://clang.llvm.org/doxygen/Lexer_8cpp_source.html. 


定义 抽象 语法 树 


抽象 语法 树 〈 以 下 简称 为 AST) 是 一 门 编程 语言 源码 的 抽象 语法 结 
构 的 树 形 表示 。 各 种 语言 组 件 ， 例 如 表达 式 、 条 件 控制 语句 等 ， 都 有 相 
应 的 AST， 并 被 区 分 为 操作 符 和 操作 数 。AST 并 不 表示 这 些 代码 如 何 由 
语法 生成 ， 而 是 表达 了 语言 组 件 之 间 的 关系 。AST 和 忽略 了 一 些 无 关 紧 要 
的 元 素 ， 例 如 标点 符号 、 定 界 符 (通常 是 空格 、 换 行 )。 男 外 ，AST 中 
的 每 个 元 素 都 会 有 一 些 附 加 的 属性 ， 在 之 后 的 编译 阶段 会 有 一 定 作用 。 
例如 ， 源 码 行 号 信息 就 是 这 样 一 个 属性 ， 在 进行 语法 检查 遇 到 语法 错误 
时 就 可 以 输出 错误 代码 的 行 号 信息 《在 C++ 的 Clang 前 端 中 ， 位 置 、 行 
号 、 列 号 等 信息 以 及 其 他 相关 属性 由 SourceManager 类 的 一 个 对 象 存 
tif) . 

AST 的 使 用 集中 在 语义 分 析 阶 段 ， 在 这 个 阶段 ， 编 译 器 会 检查 程序 
和 语言 元 素 是 人 否 正 确 使 用 。 此 外 ， 在 语义 分 析 阶 段 编 译 器 还 会 基于 AST 
生成 符号 表 。 完 整 的 树 遍 历 允 许 验证 程序 的 正确 性 。 在 验证 正确 后 ， 
AST 还 是 代码 生成 的 基础 。 


准备 工作 


在 生成 AST 之 时 ， 我 们 需要 运行 词法 分 析 器 来 得 到 token。 我 们 即将 
要 解析 的 语言 由 表达 式 、 函 数 定义 、 函 数 声明 组 成 ， 而 表达 式 又 有 多 种 
类 型 ， 包 括 变 量 、 二 元 运算 符 、 数 值 表达 式 等 。 


详细 步 又 


为 了 定义 AST 结 构 ， 执 行 以 下 步骤。 
1. 打开 toy.cpp 文 件 : 


























$ vim toy.cpp 
以 下 是 词法 分 析 器 代码 ， 定 义 了 AST。 
2. 首先 定义 一 个 base 类 解析 表达 式 : 


class BaseAST { 
public : 
virtual -BaseAST(); 
3 


还 需要 定义 几 个 派生 类 来 解析 每 一 种 类 型 的 表达 式 。 
3, 变量 表达 式 的 AST 类 定义 如 下 : 


Class VariableAST : public BaseAST{ 
std::string Var_Name; 

// 定义 string 对 象 用 作 存 储 变 量 
public: 
VariableAST (std::string &name) : Var_Name(name) {} 

// 变 量 AST 类 的 含 参 构造 函数 由 传 入 构造 函数 的 字符 串 初始 化 

}; 


























4 语言 会 包含 一 些 数值 表达 式 。 数 值 表达 式 的 AST 类 定义 如 下 ; 


class NumericAST : public BaseAST { 

int numeric_val; 

public : 

NumericAST (intval) :numeric_val(val) {} 


}; 
5. 对 于 由 二 元 运算 组 成 的 表达 式 ，AST 类 定义 如 下 : 


Class BinaryAST : public BaseAST { 
std::string Bin Operator; // 用 于 存储 二 元 运算 符 的 String 对 象 
BaseAST *LHS, *RHS; // 用 于 存储 一 个 二 元 表达 式 的 LHS 和 RHS 的 对 象 。 
// 由 于 LHS 和 RHS 二 元 操作 可 以 是 任何 类 型 ， 因 此 用 BaseAST 对 象 存储 。 
public: 
BinaryAST (std::string op, BaseAST *lhs, BaseAST *rhs ) : 
Bin Operator(op), LHS(lhs), RHS(rhs) {} 
// 初始 化 二 元 运算 符 、 二 元 表达 式 的 LHS 和 RHS 














6. 用 于 函数 声明 的 AST 类 定义 如 下 : 


class FunctionDeclAST { 
std::string Func_Name; 
std::vector<std::string> Arguments; 
public: 
FunctionDeclAST(const std::string &name, const 
std: :vector<std::string> &args) 
Func_Name(name), Arguments(args) {}; 
3 


7. 用 于 函数 定义 的 AST 类 定义 如 下 : 


class FunctionDefnAST { 
FunctionDeclAST *Func Decl; 
BaseAST* Body; 
public: 
FunctionDefnAST(FunctionDeclAST *proto, BaseAST *body) 
Func Decl(proto), Body(body) {} 


8. 用 于 函数 调用 的 AST 类 定义 如 下 : 


class FunctionCallAST : public BaseAST { 

std::string Function Callee; 

std::vector«BaseAST*» Function Arguments; 

public: 

FunctionCallAST(const std::string &callee, std::vector«BaseAST* 
&args): 

Function Callee(callee), Function Arguments(args) {} 
}; 





到 这 里 ，AST 的 基本 框架 已 经 基本 可 用 。 


LR ERR 


关于 由 词法 分 析 器 得 到 的 token 的 各 种 信息 由 AST 这 一 数据 结构 来 存 
储 ， 这 些 信息 包含 在 语法 分 析 右 的 逻辑 当中 ， 并 且 根 据 当前 解析 的 
token 类 型 来 填充 AST。 
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。 在 生成 AST 之 后 ， 我 们 会 实现 语法 分 析 器 ， 在 此 之 后 我 们 会 展示 调 
用 语法 分 析 器 和 词法 分 析 器 的 样 例 。 关 于 Clang 使 用 的 C++ AST 结 
构 的 详细 信息 ， 请 参见 
http://clang.llvm.org/docs/IntroductionToTheClangAST.html. 


GU IH NES Hd 
实现 语法 分 析 器 

语法 分 析 器 (parser) 根据 语言 的 语法 规则 来 解析 代码 ， 解 析 阶 段 
决定 了 输入 的 代码 是 否 能 够 根据 既定 的 语法 组 成 token 流 Ss。 在 此 阶段 会 
构造 出 一 棵 解析 树 ， 而 语法 分 析 占 则 会 定义 一 些 函 数 来 把 代码 组 织 成 一 
种 被 称 为 AST 的 数据 结构 。 本 节 定 义 的 解析 器 采用 了 递归 下 降 的 解析 技 
术 目 顶 回 下 解析 ， 并 用 相互 递归 的 函数 构建 AST。 


准备 工作 


我 们 需要 目 定 义 的 语言 ， 本 例 中 是 TOY 语 言 ， 以 及 由 词法 分 析 器 得 
到 的 token 流 。 


详细 步 又 


在 TOY 的 语法 分 析 器 中 定义 一 些 基本 的 变量 来 持 有 上 下 文 信息 : 














1. 打开 toy.cpp 文 件 : 


$ vim toy.cpp 


2. 定义 持 有 当前 token RAIDIR) 的 静态 全 局 变量 : 


static int Current_token; 


3. KEP BBM 8] 12 2) ri FTA LR AS P — token, WP: 


static void next token() { 
Current token - get token(); 


Pa 下 一 步 需要 使 用 前 一 节 定 义 的 AST 数 据 结构 ， 为 解析 表达 式 定 义 


5. 定义 一 个 泛 型 函数 ， 来 根据 由 词法 分 析 器 确定 的 token 类 型 调用 
特定 解析 函数 ， 如 下 : 


static BaseAST* Base Parser() { 
switch (Current token) { 
default: return 0; 
case IDENTIFIER TOKEN : return identifier parser(); 
case NUMERIC TOKEN : return numeric parser(); 
case '(' : return paran parser(); 
} 
} 


LEER 


输入 流 被 词法 分 析 器 构建 成 token 流 并 传递 给 语法 分 析 器 。 
Current. token 持 有 当前 处 理 的 token。 在 这 一 阶段 token 的 类 型 是 已 知 
的 ， 并 根据 其 类 型 来 调用 相应 的 解析 函数 来 初始 化 AST。 


HZ pn] 


。 在 下 面 儿 市 中 ， 我 们 会 EA ae ee 关于 Clang 使 
用 的 C++ 解析 技术 的 详细 内 容 ， 请 参见 
http://clang.llvm.org/doxygen/classclang 1 1Parser.html. 


fi ATT fe] HL EK] EIA TK 
本 节 介 绍 如 何 解析 简单 的 表达 式 。 一 个 简单 的 表达 式 由 数值 、 标 识 


符 、 函 数 调 有 用、 函数 声明 和 函数 定义 组 成 。 对 于 每 一 种 类 型 的 表达 陈 ， 
需要 定义 独立 的 解析 逻辑 。 


准备 工作 


我 们 需要 目 定 义 的 语言 《本 例 中 是 TOY 语 言 ) 以 及 从 词法 分 析 需 生 
成 的 token 流 。 在 此 之 前 我 们 已 经 定义 了 AST， 所 以 在 这 里 只 要 解析 表达 
式 并 且 为 每 种 类 型 的 表达 式 调用 相应 的 AST 构 造 函 数 即 可 。 


详细 步 又 


执行 以 下 的 代码 来 解析 简单 的 表达 式 。 
1. 打开 toy.cpp 文 件 : 


$ vi toy.cpp 


在 toy.cpp 文 件 中 已 经 完成 了 词法 分 析 的 逻辑 ， 其 他 的 代码 需要 写 在 
词法 分 析 后 面 。 


2. 定义 如 下 的 parser 函 数 来 解析 数值 表达 式 : 


static BaseAST *numeric_parser() { 
BaseAST *Result = new NumericAST(Numeric Val); 
next token(); 
return Result; 


Í 








3. 定义 parser 函 数 来 解析 标识 符 表达 式 。 需 要 注意 的 是 ， 标 识 符 可 
以 是 变量 引用 ， 或 者 是 函数 调用 。 它 们 之 间 通 过 函数 调用 会 由 括号 这 一 
特征 来 区 分 。 实 现 如 下 : 


static BaseAST* identifier_parser() { 
std::string IdName = Identifier_string; 


next_token(); 


if(Current token != '(') 
return new VariableAST(IdName) ; 


next_token(); 


std: :vector<BaseAST*> Args; 
if(Current_token != ')') { 
while(1) { 
BaseAST* Arg = expression parser(); 
if(!Arg) return 0; 
Args.push back(Arg); 


if(Current token == ')') break; 
if(Current token !- ',') 

return 0; 

next token(); 


} 
next_token(); 


return new FunctionCallAST(IdName, Args); 


} 
4. 定义 如 下 的 parser 函 数 来 解析 函数 声明 


static FunctionDeclAST *func_decl_parser() { 
if(Current token != IDENTIFIER TOKEN) 
return 0; 


std::string FnName - Identifier string; 
next token(); 


if(Current token != '(') 
return 0; 


std: :vector<std::string> Function Argument Names; 


while(next token() == IDENTIFIER TOKEN) 

Function Argument Names.push back(Identifier string); 
if(Current token !- ')') 

return 0; 


next token(); 


return new FunctionDeclAST(FnName, Function Argument Names); 


5. 定义 如 下 的 parser 函 数 来 解析 函数 定义 : 


static FunctionDefnAST *func_defn_parser() { 
next token(); 
FunctionDeclAST *Decl - func decl parser(); 
if(Decl -- 0) return 0; 


if(BaseAST* Body - expression parser()) 
return new FunctionDefnAST(Decl, Body); 
return 0; 


各 要 注意 ， 这 个 函数 调用 了 前 面 代码 中 的 expression_parser 来 解析 
表达 式 ， 其 函数 定义 如 下 : 


static BaseAST* expression_parser() { 
BaseAST *LHS = Base Parser(); 
if(!LHS) return 0; 
return binary op parser(0, LHS); 


j 


LEER 


如 果 明 到 一 个 数值 token， 那 么 调用 数值 表达 式 的 构造 函数 并 由 解 
析 器 返回 数值 的 AST 对 象 ， 用 数值 数据 填充 数值 AST。 


而 标识 符 表达 式 也 与 此 类 似 ， 解 析 的 数据 可 以 古 变 量 或 者 函数 调 
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用 相应 AST 类 的 构造 函数 。 


解析 二 元 表达 式 
本 节 介 绍 如 何 解 析 二 元 表达 式 。 
准备 工作 


我 们 需要 目 定义 的 语言 《本 例 中 是 TOY 语 言 )》 ， 以 及 由 词法 分 析 器 
生成 token 流 。 二 元 表达 式 的 解析 器 在 按 顺 序 决 定 LHS 和 RHS 的 时 候 需 要 
知道 二 元 运算 符 的 优先 级 ， 而 这 可 以 用 STL 中 的 map 来 表示 。 


详细 步 又 


执行 以 下 步骤 以 解析 二 元 表达 式 。 
1. 打开 toy.cpp 文 件 : 





$ vi toy.cpp 


2. ”在 toy.cpp 文 件 的 全 局 作用 域内 声明 一 个 map 来 存储 运算 和 从 优先 
级 : 


static std::map<char, int>Operator_Precedence; 


这 里 展示 的 TOY 语 言 有 4 个 运算 符 ， 并 具有 以 下 的 优先 级 : 








-< +< /« * 


3. ”还 需要 一 个 初始 化 优先 级 的 函数 ， 即 把 优先 级 数值 存储 在 map 
中 ， 也 定义 在 toy.cpp 的 全 局 作用 域内 : 


static void init precedence() i 
Operator Precedence - ] 
Operator_Precedence[ '+' | 
Operator Precedence['/'] 
Operator Precedence['*'] 


ON 


4. 一 个 辅助 函数 ， 以 返回 已 定义 的 二 元 运算 符 的 优先 级 ， 定 义 如 
F: 


static int getBinOpPrecedence() { 
if(!isascii(Current token)) 
return -1; 


int TokPrec - Operator Precedence[Current token]; 
if(TokPrec<= 0) return -1; 
return TokPrec; 


j 
5. 现在 ， 可 以 定义 解析 binary 运 算 符 的 解析 器 了 : 


static BaseAST* binary op parser(int Old Prec, BaseAST *LHS) { 
while(1) { 
int Operator Prec - getBinOpPrecedence(); 
if(Operator Prec« Old Prec) 
return LHS; 


int BinOp - Current token; 
next token(); 


BaseAST* RHS - Base Parser(); 
if(!RHS) return 0; 


int Next Prec - getBinOpPrecedence(); 
if(Operator Prec« Next Prec) ( 

RHS = binary op parser(Operator Prec-*1, RHS); 
if(RHS -- 0) return 90; 


LHS - new BinaryAST(std::to string(BinOp), LHS, RHS); 


在 这 里 ， 当 前 运算 符 的 优先 级 和 之 前 运算 符 的 优先 级 一 起 被 检查 ， 
输出 则 取决 于 二 元 运算 符 的 LHS 和 RHS。 需 要 注意 的 是 ， 二 元 运算 符 解 
| 
示 识 符 。 


6. 括号 的 parser 函 数 定义 如 下 : 


static BaseAST* paran_parser() { 
next_token(); 
BaseAST* V = expression parser(); 
if (!V) return 0; 


if(Current token !- ')') 
return 0; 
return V; 





7. € XL — Eee E PR BOR S] AR parser 2X, TE MUN: 


static void HandleDefn() { 
if (FunctionDefnAST *F = func defn parser()) { 
if(Function* LF = F->Codegen()) { 
j 


else ( 
next token(); 
} 
} 


static void HandleTopExpression() { 
if(FunctionDefnAST *F = top_level_parser()) { 
if(Function *LF = F->Codegen()) { 
J 
} 
else { 
next_token(); 
} 
} 
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。 本 章 接 下 来 的 儿 市 都 是 天 于 自 定义 对 象 解析 的 。 关 于 C++ 表 达 式 解 
析 的 详细 内 容 ， 请 参见 
http://clang.llvm.org/doxygen/classclang 1 1Parser.html. 


为 解析 编写 驱动 


本 节 介 绍 如 何在 TOY 解 析 器 的 主 函 数 中 调用 解析 函数 ， 即 为 解析 水 
数 编 写 驱 动 。 


VY Te 
详细 步骤 
为 了 调用 驱动 程序 以 开始 解析 ， 义 如 下 的 驱动 函数 。 


1. 打开 toy.cpp 文 件 : 


$ vi toy.cpp 


2. Driver Ki žit h E KAOH, HEITE XU F: 


static void Driver() { 
while(1) { 
switch(Current_token) { 
case EOF_TOKEN : return; 
case ';' : next_token(); break; 
case DEF_TOKEN : HandleDefn(); break; 
default : HandleTopExpression(); break; 


3. 运行 整个 程序 的 main(0) 函 数 定义 如 下 : 


int main(int argc, char* argv[]) { 
LLVMContext &Context = getGlobalContext(); 
init precedence(); 
file - fopen(argv[1], "r"); 
if(file -- 0) ( 
printf("Could not open file\n"); 


next token(); 


Module Ob = new Module("my compiler", Context); 
Driver(); 
Module Ob-»dump(); 

return 0; 


WY 


CER E 


主 函 数 负 责 调用 词法 分 析 器 和 语法 分 析 器 ， 二 者 都 作用 于 输入 编译 
需 前 端的 代码 段 。 在 主 函 数 中 ， 会 调用 驱动 函数 ， 开 始 解析 输入 代码 。 


HWZ p] 


。 关于 Clang 中 解析 C++ 语 言 的 主 函数 和 驱动 函数 的 详细 内 容 ， 请 参见 
http:// lIvm.org/viewvc/llvm- 
project/cfe/trunk/tools/driver/cc1 main.cpp. 


对 TOY 语 言 进行 词法 分 析 和 语法 分 析 


既然 已 经 为 TOY 语 言语 法 定义 了 完整 的 词法 分 析 顺 和 语法 分 析 峰 ， 
下 面 可 以 开始 用 TOY 语 言 运 行 样 例 了 。 


HER LE 
你 需要 对 TOY 语 言 的 语法 有 所 了 解 ， 以 及 本 章 前 几 节 的 预备 知识 。 


~ LE HEZ 

详细 步骤 

, 执行 以 下 的 步 电 用 TOY 语 言 来 运行 并 测试 订 法 分 析 吕 和 语法 分 析 
1 首先 编译 tov cpp 程 序 ， 得 到 可 执行 文件 ; 


$ clang++ toy.cpp -03 -o toy 
”“” 2. 得 到 的 toy 可 执行 文件 即 是 TOY 编 译 器 的 前 端 ， 准 备 解析 的 toy 语 
言 文件 是 example 文 件 : 


$ cat example 
def foo(x , y) 
x + y * 16 


3. FEOCTEAA TE AB BUG XS 2 toy Fai VE nis AE EE 


$ ./toy example 


CER 


TOY 编 译 器 会 以 读 模式 打开 example 文 件 ， 并 且 将 单词 组 织 成 token 
流 。 如 果 遇 到 def 关 键 字 即 返 回 DEF_TOKEN， 然 后 调用 HandleDefn() 函 
数 ， 它 会 存储 函数 名 和 参数 。 程 序 会 递归 地 检查 token 的 类 型 ， 然 后 调 
用 特定 的 token 处 理 函 数 ， 把 信息 存储 在 各 自 的 AST 中 。 
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误 。 为 了 实现 错误 处 理 ， 请 参见 
http://llvm.org/docs/tutorial/LangImpl2.html£parser-basics . 


为 每 个 AST 类 定义 IR 代 码 生 成 方法 


现在 所 有 必要 信息 都 存储 于 AST 这 一 数据 结构 中 ， 下 一 阶段 即 是 从 
AST 生 成 LLVM IR。 在 代码 生成 的 过 程 中 我 们 需要 使 用 LLVM 的 API， 
通过 LLVM 内 建 的 API 可 以 生成 预定 义 格式 的 LLVM IR。 


准备 工作 
你 需要 为 输入 的 任意 TOY 语 言 代 码 创 建 AST。 
详细 步骤 


为 了 生成 LLVM IJIR， 我 们 需要 在 每 个 AST 类 定义 一 个 CodeGen 虚 函 
数 CAST 类 在 前 面 的 AST 相 关 章 节 己 经 定义 过 ， 这 些 函 数 需要 另外 添加 
到 这 些 类 中 ) ， 实 现 如 下 : 


1. 打开 toy.cpp 文 件 : 








$ vi toy.cpp 


2. 在 之 前 定义 的 BaseAST 类 ， 以 及 它 的 子 类 中 添加 Codegen() 函 数 : 
class BaseAST { 


virtual Value* Codegen() = 0; 


3 
class NumericAST : public BaseAST ( 


virtual Value* Codegen(); 


了 


class VariableAST : public BaseAST { 


virtual Value* Codegen(); 


}; 
我 们 定义 的 每 一 个 AST 类 都 需要 包含 Codegen0 函 数 。 


这 一 函数 返回 值 是 LLVM Value 对 象 ， 它 表示 了 静态 单 赋值 
(SSA) 对 象 。 在 Codegen 过 程 中 还 需要 定义 几 个 静态 对 象 。 


3. 在 全 局 作用 域 中 声明 如 下 的 静态 变量 : 


static Module *Module Ob; 
static IRBuilder<> Builder(getGlobalContext()); 
static std::map<std::string, Value*-Named Values; 


LER 


Module_Ob 模 块 包含 了 代码 中 的 所 有 函数 和 变量 。 


Builder 对 象 帮助 生成 LLVM IR 并 且 记 录 程 序 的 当前 点 ， 以 插入 
LLVM 指 令 。 另 外 ，Builder 对 象 有 创建 新 指令 的 函数 。 


Named_ Valuesmap 对 象 记 录 当 前 作用 域 中 的 所 有 已 定义 值 ， 充 当 符 
号 表 的 功能 。 对 我 们 的 TOY 语 言 来 说 ， 这 个 map 也 会 包含 函数 参数 信 





为 表达 


本 节 将 展示 如 何 使 用 编译 嚣 前端 来 为 表达 陈 生 成 节 代 码 。 


详细 步 又 


为 了 实现 TOY 语 言 的 LLYM IR 代 码 生 成 器 ， 需 要 执行 以 下 步骤 。 


1. 打开 toy.cpp 文 件 : 








$ vi toy.cpp 


2. 为 数值 变量 生成 代码 的 函数 定义 如 下 : 


Value *NumericAST::Codegen() { 
return ConstantInt::get(Type::getInt32Ty(getGlobalContext()), 
numeric val); 


在 LLVM IR 中 ， 整 数 常量 由 ConstantInt 类 表示 ， 它 的 值 由 APInt 类 持 


3. 为 变量 表达 式 生 成 代码 的 函数 定义 如 下 : 


Value *VariableAST::Codegen() { 
Value *V = Named_Values[Var_Name]; 
return V? V : 0; 


} 
4. 二 元 表达 式 的 Codegen() 函 数 定义 如 下 : 


Value *BinaryAST: :Codegen() { 
Value *L = LHS->Codegen(); 
Value *R = RHS-»Codegen(); 


if(L == 0 || R == 0) return 0; 


switch(atoi(Bin Operator.c str())) { 
case '+' : return Builder.CreateAdd(L, R, "addtmp"); 


case '-' : return Builder.CreateSub(L, R, "subtmp"); 
case '*' : return Builder.CreateMul(L, R, "multmp"); 
case '/' : return Builder.CreateUDiv(L, R, "divtmp"); 
default : return 0; 
} 
} 


如 果 上 面 的 代码 生成 了 多 个 addtmp 变 量 ，LLVM 会 自动 为 每 一 个 
addtmp 添 加 递增 的 、 唯 一 的 数值 后 级 加 以 区 分 。 
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为 函数 生成 IR 代 码 


ASS IP A n fu] Ay RA TRUE IR ACES o 


详细 步骤 
执行 以 下 步骤。 


1. KAH H Codegen) A žE XW F: 


Value *FunctionCallAST::Codegen() { 

Function *CalleeF = 

Module Ob-»getFunction(Function Callee); 

std: :vector<Value*>Argsv; 

for(unsigned i = 0, e = Function Arguments.size(); 

i != e; ++i) { 
ArgsV.push_back(Function_Arguments[i]->Codegen()); 
if(ArgsV.back() == 0) return 0; 

} 

return Builder.CreateCall(CalleeF, ArgsV, "calltmp"); 


解析 函数 调用 时 ， 会 递归 地 对 其 传递 的 参数 调用 Codegen(O) 函 数 ， 
最 后 创建 LLVM 调 用 指令 。 


2. ”既然 函数 调用 的 Codegen() 函 数 已 经 定义 ， 是 时 候 为 函数 声明 和 
PK Zi E X Sc CodegenO KAUT - 


KAE AY HY Codegen() P BLUE X, Wl F: 


Function *FunctionDeclAST::Codegen() { 

std: :vector<Type*>Integers(Arguments.size(), Type::getInt32Ty(g 
tGlobalContext())); 

FunctionType *FT = FunctionType::get(Type::getInt32Ty(getGlobal 
ontext()), Integers, false); 

Function *F = Function::Create(FT, Function: :ExternalLinkage, 


Func Name, Module 0b); 


if(F->getName() != Func Name) { 
F->eraseFromParent(); 
F = Module Ob-»getFunction(Func Name); 


if(!F->empty()) return 0; 
if(F->arg_size() != Arguments.size()) return 0; 


j 


unsigned Idx = 0; 
for(Function::arg iterator Arg It = F->arg_begin(); Idx != 
Arguments.size(); ++Arg_It, ++Idx) { 
Arg_It->setName(Arguments[Idx]); 
Named_Values[Arguments[Idx]] = Arg_It; 
} 


return F; 


j 
RUE X II CodegenO A ZA sg: SCA TF: 


Function *FunctionDefnAST::Codegen() { 
Named Values.clear(); 


Function *TheFunction - Func Decl-»Codegen(); 
if(TheFunction -- 0) return 0; 


BasicBlock *BB = BasicBlock::Create(getGlobalContext(), "entry", 
TheFunction); 
Builder.SetInsertPoint(BB); 


if(Value *RetVal = Body->Codegen()) { 
Builder.CreateRet(RetVal); 
verifyFunction(*TheFunction); 
return TheFunction; 


j 


TheFunction->eraseFromParent(); 
return 0; 


3. 好 了 ，LLVM IR 已 经 准备 好 了 ! 这 些 Codegen() 函 数 会 被 解析 顶 
层 表 达 式 的 包装 函数 调用 ， 定 义 如 下 : 


static void HandleDefn() { 
if (FunctionDefnAST *F = func_defn_parser()) { 
if(Function* LF = F->Codegen()) { 
} 
} 
else { 
next_token(); 


} 
} 
static void HandleTopExpression() { 
if(FunctionDefnAST *F = top_level_parser()) { 
if(Function *LF = F->Codegen()) { 
} 
} 


else { 
next_token(); 


j 
j 


所 以 ， 在 成 功 解析 之 后 ， 相 应 的 Codegen0 函 数 会 被 调用 以 生成 
LLVM IR。 而 dumpO 函 数 则 会 被 调用 以 输出 生成 的 IR。 


“LE Re 


Codegen0 函 数 使 用 了 LLVM 内 建 的 函数 调用 来 生成 及， 因此 需要 引 
入 这 些 头 文件 : llvnIR/Verifier.h、1llvnmIR/DerivedTypes.h、 
Ilvm/IR/IRBuilder.h. llvm/IR/LLVMContext.h^lllvm/IR/Module.h. 


1. 在 编译 的 时 候 ， 这 些 代码 需要 链接 到 LLVM 库 中 ， 因 此 llvm- 
config 工 具 能 够 派 上 用 场 : 


llvm-config --cxxflags --ldflags --system-libs --libs core 


2. 因此 toy 程 友 也 需要 重新 编译 ， 并 添加 一 些 和 额外 的 参数 : 


$ clang++ -03 toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs 
--libs core -o toy 


3: 当 toy 编 译 器 在 example 程 序 上 运行 的 时 候 ， 它 会 生成 如 下 的 
LLVM IR: 


$ ./toy example 


define i32 Qfoo (132 %x, i32 %y) ( 
entry: 
%multmp = muli32 %y, 16 
%addtmp = add i32 %x, %multmp 
reti32 %addtmp 


另 一 个 示例 程序 example2 包 含 一 个 函数 调用 : 


$ cat example2 
foo(5, 6); 


会 得 到 如 下 的 LLVM IR: 


$ ./toy example2 

define i32 @1 () { 
entry: 
%calltmp = call i320foo(i32 5, i32 6) 
reti32 %calltmp 

} 
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。 关于 Clang 中 用 C++ 编 写 的 Codegen() 函 数 的 详细 信息 ， 请 参见 
http://llvm.org/viewvc/llvm-project/cfe/trunk/lib/CodeGen/. 


增加 JIR 优 化 文 持 


LLVM 提 供 了 多 种 多 样 的 优化 Pass， 并 且 人 允许 第 三 方 编译 器 实现 来 
决定 使 用 哪些 优化 ， 及 优化 的 顺序 等 。 本 节 介 绍 如 何 增 加 IR 优 化 支持 。 


WEE 
执行 以 下 步骤 。 


1. 在 增加 了 优化 文 持 之 前 ， 移 定义 一 个 静态 变量 来 管理 函数 ， 如 
F: 


static FunctionPassManager *Global_FP; 


2. 然后 需要 为 之 前 使 用 的 Module 对 象 定 义 一 个 函数 Pass 管 理 器 ， 定 
X T mainQrf ir: 


FunctionPassManager My FP(TheModule); 


3. MLE n] D fEmain( ER Zi HP 8 I — Z8 91] Rh UL T Pass T : 


My FP.add(createBasicAliasAnalysisPass()); 
My FP.add(createlInstructionCombiningPass()); 
My FP.add(createReassociatePass()); 

My FP.add(createGVNPass( )); 

My FP.doInitialization(); 


4. MEJE — KH Fl Pass MME £5 45 Jen AS PR ZA Pass E: PE aas: 


Global FP - &My FP; 
Driver(); 


这 个 PassManager 有 一 个 名 为 run 的 方法 ， 我 们 可 以 在 函数 定义 的 


Codegen0 返 回 之 前 运行 这 个 方法 生成 IR。 展 示 如 下 : 


Function* FunctionDefnAST::Codegen() { 
Named Values.clear(); 
Function *TheFunction - Func Decl-»Codegen(); 
if (!TheFunction) return 0; 
BasicBlock *BB - BasicBlock::Create(getGlobalContext(), "entry" 
TheFunction); 
Builder .SetInsertPoint(BB); 
if (Value* Return_Value = Body->Codegen()) { 
Builder.CreateRet(Return Value); 
verifyFunction(*TheFunction); 
Global FP-»run(*TheFunction); 
returnTheFunction; 


TheFunction-»eraseFromParent(); 


return 0; 


j 


这 样 的 优化 有 许多 优势 ， 因 为 它 就 地 (inplace〉 改 变 函 数 体 ， 即 直 
接 改 进 函 数 体 生成 的 代码 ， 而 不 会 进行 复制 。 


另 请 参阅 


。 关于 如 何 增 加 自 定义 的 优化 Pass 及 其 mn 方法 将 会 在 之 后 的 章节 演 
Ze 











岂非 终结 符号 : 在 形式 语言 中 ， 非 终结 符号 指 的 是 ， 根 据 推导 规 
则 ， 可 以 被 其 他 符 写 蔡 换 的 符号 。 译 者 注 


[2] 终 结 符号 ， 在 形式 语言 中 ， 终 结 符号 是 语言 的 基本 符号 ， 它 不 可 
以 被 分 解 或 替换 。 也 就 是 说 推导 到 终结 符号 时 推导 过 程 便 终结 了 。 
译 者 注 





比 








ry 





H 


[3] 上 下 文 无 关 语 法 : Context-Free Grammar (CFG) , X >= Y, X 
可 以 被 Y 蔡 换 ， 而 无 顷 考 虑 X 的 上 下 文 ， 在 这 里 又 是 一 个 非 终结 符 。 与 之 


对 应 的 是 上 下 文 相关 语法 ，aX >= Y, bX >= Z， 在 不 同 的 推导 规则 中 XX 具 
有 不 同 的 语义 ， 因 此 称 之 为 上 下 文 相关 语法 。 一 一 译 者 注 


攻 ] 这 里 使 用 vim 编 辑 器 ， 你 也 可 以 采用 其 他 的 。 一 一 译 者 注 


[5] 原 文 为 a string of tokens， 译 者 认为 原文 可 能 存在 错误 ， 应 为 a 
stream of tokens， 故 根据 上 下 文 译 成 token 流 。 译 者 注 


[6] 原 文 为 把 全 局 静态 函数 Pass 管 理 器 复制 给 当前 的 管理 器 ， 译 者 根 
据 代 码 纠 正 此 处 错误 。 译 者 注 
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if/then/elseZ5 #4) 


概述 


在 第 2 半 中 ， 我 们 已 经 实现 了 一 门 语 言 的 前 端 组 件 的 基本 框 染 ， 包 
括 为 不 同类 型 的 表达 式 定 义 token， 实 现 一 个 词法 分 析 器 来 把 代码 构建 
成 token 流 ， 定 义 了 各 种 类 型 表达 式 的 AST， 实 现 了 语法 分 析 器 ， 并 且 为 
a 0 0 


但 是 这 时 候 TOY 语 言 还 不 够 完备 ， 因 为 它 还 不 具备 基本 的 控制 流 和 
循环 ， 只 有 具备 了 这 些 ， 它 才 算得 上 强大 并 具有 表现 力 。JII 文 持 则 探 
讨 了 在 运行 时 即时 编译 代码 的 可 能 性 。 本 章 将 讨论 这 些 更 加 复杂 的 语言 
特性 及 其 实现 ， 这 些 特性 增强 了 TOY 语 言 ， 使 得 TOY 语 言 更 加 实用 、 更 
加 强大 。 本 章 的 几 节 展示 了 如 何 为 一 门 给 定 的 语言 增加 这 些 特性 。 























处 理 条 件 控制 结构 if/then/else 结 构 


对 于 任何 编程 语言 来 说 ， 如 果 它 能 够 基于 一 定 的 条 件 执 行 一 条 语 
人 名 ， 那 么 这 会 给 这 门 语言 带 来 非常 强大 的 优势 。 语 言 中 常见 的 条 件 控制 
结构 如 if/then/else， 赋 予 了 一 门 语言 能 够 根据 特定 条 件 修改 程序 控制 流 
的 能 力 。If 语 句 表 示 条 件 ， 如 果 条 件 为 真 ， 则 执行 then 结 构 之 后 的 语 
]， 奋 则 执行 else 结 构 之 后 的 语句 。 本 节 介 绍 了 解析 if/then/else 结 构 以 及 
为 其 解析 和 生成 代码 的 一 些 基本 方法 。 


准备 工作 


TOY 语 言 的 if/then/else 定 义 如 下 : 








if x< 2 then 
x+y 

else 

X Siy. 


为 了 检查 条 件 ， 至 少 需 要 一 个 比较 运算 符 。 这 里 使 用 了 “<”， 一 个 


简单 的 小 于 运算 符 。 为 了 处 理 < ， 需 要 在 init_precedence() 函 数 中 定义 运 
算 符 的 优先 级 ， 如 下 : 


static void init_precedence() { 
Operator Precedence['«'] = 0; 


jt RE, Er Xt ZO JURIAN A Codegen) eA AC tH m BEHELD Ab <p 
fj: 


Value* BinaryAST::Codegen() ( 


case '«' 

L = Builder.CreateICmpULT(L, R, "cmptmp"); 

return Builder.CreateZExt(L, Type::getInt32Ty(getGlobalContext()) 
"booltmp");... 


现在 ，LLVM IR 将 生成 一 个 比较 指令 及 布尔 指令 作为 比较 结果 ， 而 
比较 结果 则 会 决定 程序 的 控制 流 。 有 了 以 上 的 基础 ， 我 们 现在 可 以 处 理 
if/then/else 模 式 了 。 


详细 步骤 
执行 以 下 步骤。 


1. 为 了 处 理 if/then/else 结 构 ，toy.cpp 文 件 中 的 词法 分 析 器 需要 扩 
展 。 首 先 在 enum 类 型 中 增加 一 种 token 类 型 : 


enum Token Type( 


IF TOKEN, 
THEN. TOKEN, 
ELSE TOKEN 
j 


2. 然后 在 get_token() 函 数 中 增加 这 些 token 的 条 目 ， 它 们 匹配 字符 串 
并 返回 相应 的 token: 


static int get_token() { 


if(Identifier_string == "def") return DEF_TOKEN; 
if(Identifier_string == "if") return IF_TOKEN; 
if(Identifier_string == "then") return THEN_TOKEN; 


if(Identifier_string == "else") return ELSE_TOKEN; 


3. BE fEtoy.cpp LAFF 4E MAST KA: 


class ExprIfAST : public BaseAST { 
BaseAST *Cond, *Then, *Else; 
public: 
ExprIfAST(BaseAST *cond, BaseAST *then, BaseAST * else st) 
: Cond(cond), Then(then), Else(else st) {} 
Value *Codegen() override; 


}; 
4. 接着 为 ifthen/else 结 构 定 义 解 机 逻辑 : 


static BaseAST *If_parser() { 
next_token(); 


BaseAST *Cond = expression_parser(); 
if (!Cond) 
return 0; 


if (Current_token != THEN_TOKEN) 
return 0; 
next_token(); 


BaseAST *Then = expression_parser(); 
if (Then == 0) 
return 0; 


If (Current_token != ELSE_TOKEN) 
return 0; 


next_token(); 
BaseAST *Else = expression_parser(); 
if (!Else) 


return 0; 


return new ExprlIfAST(Cond, Then, Else); 


解析 逻辑 倒是 很 简单 ;首先 查找 if token， 以 及 解析 紧 随 其 后 的 条 件 
表达 式 。 之 后 是 标识 then token， 以 及 解析 true 条 件 表达 式 ; 最 后 是 查找 


else token 和 解析 false 条 件 表 达 式 。 
还 需要 把 之 前 定义 的 函数 和 Base_Parser() 连 接 在 一 起 : 


static BaseAST* Base Parser() { 
switch(Current_token) { 


case IF TOKEN : return If parser(); 


6. 既然 ithen/else 结 构 的 AST 已 经 被 语法 分 析 器 填充 了 表达 式 ， 接 


下 来 瓯 是 为 其 生成 LLVM IR 了 ， 让 我 们 来 定义 Codegen0 〇 函数 : 


Value *ExprIfAST::Codegen() { 
Value *Condtn = Cond-»Codegen(); 
if (Condtn -- 0) 
return 0; 
Condtn = Builder.CreatelCmpNE( 
Condtn, Builder.getInt32(0), "ifcond"); 


Function *TheFunc = Builder.GetInsertBlock()->getParent(); 


BasicBlock *ThenBB = 
BasicBlock::Create(getGlobalContext(), "then", TheFunc); 
BasicBlock *ElseBB - BasicBlock::Create(getGlobalContext(), 
"else"); 
BasicBlock *MergeBB - BasicBlock::Create(getGlobalContext(), 
"ifcont"); 


Builder.CreateCondBr(Condtn, ThenBB, ElseBB); 
Builder.SetInsertPoint(ThenBB); 


Value *ThenVal = Then-»Codegen(); 
if (ThenVal -- 0) 

return 0; 
Builder.CreateBr(MergeBB); 
ThenBB - Builder.GetInsertBlock(); 


TheFunc-»getBasicBlockList().push back(ElseBB); 
Builder.SetInsertPoint(ElseBB); 


Value *ElseVal = Else-»Codegen(); 
if (ElseVal == 0) 
return 0; 


Builder .CreateBr(MergeBB) ; 
ElseBB = Builder.GetInsertBlock(); 


TheFunc->getBasicBlockList().push_back(MergeBB) ; 

Builder .SetInsertPoint (MergeBB) ; 

PHINode *Phi = Builder.CreatePHI(Type: :getInt32Ty(getGlobalCont 
xt()), 2, "iftmp"); 

Phi->addIncoming(ThenVal, ThenBB); 


Phi->addIncoming(ElseVal, ElseBB); 
return Phi; 


Jj 


代码 已 经 束 绕 ， 让 我 们 编译 一 下 ， 在 包含 if/then/else 结 构 的 样 例 程 
序 上 编译 和 运行 。 


“CE RS 


执行 以 下 步骤。 


1. 编译 toy.cpp 文 件 : 


$ g++ -g toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs --libs core ~ -03 -o toy 


2. 打开 样 例文 件 : 


$ vi example 


3. 在 样 例文 件 中 编写 一 段 包 含 if/then/else 结 构 的 代码 : 





def fib(x) 
if x< 3 then 


1 
Else 
fib(x-1)+fib(x-2); 


4. 用 TOY 编 译 器 去 编译 样 例文 件 : 


$ ./toy example 


if/then/else 结 构 代 码 生成 的 LLVM IR 如 下 : 


; ModuleID = 'my compiler' 
target datalayout =  "e-m:e-p:32:32-f64:32:64-f80:32-n8:16:32- 
$128" 


define i32 Qfib(i32 %x) ( 
entry: 
%cmptmp = icmp ult i32 9x, 3 
br i1 %cmptmp, label %ifcont, label %else 


else: ; pr 
%subtmp = add i32 %x, -1 
%calltmp call i32 Qfib(i32 %subtmp) 
%subtmp1 add i32 %x, -2 
%calltmp2 = call i32 @fib(i32 %subtmp1) 
%addtmp = add i32 %calltmp2, %calltmp 
br label %ifcont 


ifcont: ; pr 
%else 

%iftmp = phi i32 [ %addtmp, %else ], [ 1, %entry ] 

ret i32 %iftmp 


} 
得 到 的 输出 如 下 : 


解析 器 会 识别 if/then/else 结 构 以 及 根据 条 件 真 假 执行 的 相应 语句 ， 
将 数据 存储 于 AST 中 ， 以 构建 AST。 之 后 代码 生成 器 会 把 AST 转 成 
LLVM IR， 条 件 语 句 随 之 生成 。 无 论 条 件 为 真 还 是 假 ， 都 会 生成 IR， 而 
具体 执行 哪 一 个 相应 的 分 支 ， 则 取决 于 执行 时 条 件 变 量 的 状态 。 
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。 关于 Clang 如 何 处 理 C++ 语 言 的 if _ else 语句 的 一 些 具体 样 例 ， 请 参见 
http://clang.llvm.org/doxygen/classclang 1 1IfStmt.html. 


生成 循环 结构 


循环 结构 使 得 语言 能 够 多 次 执行 相同 的 任务 ， 却 只 需要 有 限 的 几 行 
代码 ， 这 是 一 种 强 有 力 的 特性 ， 因 此 几乎 所 有 的 语言 都 会 有 循环 结构 。 
本 市 将 为 TOY 语 言 实现 循环 结构 。 


准备 工作 


循环 结构 通 第 需要 先 初 始 化 一 个 归纳 变量 ， 然 后 对 这 个 变量 做 更 新 
增加 或 减少 其 数值 ) ， 以 及 一 个 表示 循环 结束 的 终止 条 件 。 因 此 我 们 
的 TOY 语 言 的 循环 结构 定义 如 下 : 





for i = 1, i< n, 1 in 
X + y; 
初始 化 表达 式 是 i = 1， 终 止 条 件 是 i < n， 第 1 行 代 码 表 示 i 以 1 为 步 长 
递增 。 
只 要 终止 条 件 为 真 ， 循 环 束 不 会 终止 ;每 次 友 代 ， 归 纳 变量 ji 会 增 
加 1。 这 里 牵涉 一 个 有 趣 的 东西 叫 PHI 节 点 ， 它 会 选择 来 自 不 同 分支 的 
i， 因 为 我 们 的 IR 是 SSA (single static assignment, PA HD 形式 
的 。 在 控制 流 图 中 ， 一 个 给 定 的 变量 可 以 来 自 两 个 不 同 的 基本 块 ( 两 条 
不 同 的 路 径 ) ， 为 了 在 SSA 形 式 的 LLVM IR 中 表达 这 种 分 支 情况 ， 需 要 
用 到 phi 指 令 ， 举 个 例子 : 





%1 = phi i32 [ 1, %entry ], [ %nextvar, %loop ] 


这 里 的 IR 表 明 变 量 i 的 值 可 能 会 来 自 两 个 基本 块 ，%entry 或 
者 %loop。 来 和 目 %entry 块 的 变量 值 是 1， 而 %nextvar 变 量 将 来 和 目 %1loop。 
在 为 TOY 编 译 器 实现 循环 结构 之 后 会 来 查看 这 些 细 市 。 





详细 步 又 


就 像 任何 其 他 的 表达 式 一 样 ， 循 环 也 需要 在 词法 分 析 器 中 通过 包 合 


的 状态 来 处 理 ， 定 义 持 有 循环 变量 的 AST 数 据 结构 ， 以 及 定义 语 


器 和 Codegen0 函 数 来 生成 LLVM IR: 
1. 首先 在 toy.cpp 文 件 的 词法 分 析 器 中 定义 token: 


enum Token_Type { 


FOR_TOKEN, 
IN_TOKEN 


T 


2. 然后 实现 词法 分 析 的 逻辑 : 


static int get token() { 


if(Identifier_string == "else") 
return ELSE TOKEN; 
if (Identifier string -- "for") 
return FOR TOKEN; 
if (Identifier string -- "in") 


return IN TOKEN; 


3. 接着 为 for 循 环 定 义 AST: 


class ExprForAST : public BaseAST { 
std::string Var_Name; 
BaseAST *Start, *End, *Step, *Body; 


public: 
ExprForAST (const std::string &varname, BaseAST *start, 


法 分 析 


BaseAST 


*end, 
BaseAST *step, BaseAST *body) 
: Var_Name(varname), Start(start), End(end), Step(step), 
Body(body) {} 
Value *Codegen() override; 


}; 
4. 然后 为 循环 结构 定义 解析 逻辑 : 


static BaseAST *For_parser() { 
next_token(); 


if (Current token !- IDENTIFIER TOKEN) 
return 0; 


std::string IdName - Identifier string; 
next token(); 


if (Current token !- '=') 
return 0; 
next token(); 


BaseAST *Start - expression parser(); 
if (Start -- 0) 
return 0; 
if (Current token !- ',') 
return 0; 
next token(); 


BaseAST *End - expression parser(); 
if (End -- 0) 
return 0; 


BaseAST *Step - 0; 
if (Current token == ',') { 
next token(); 
Step - expression parser(); 
if (Step -- 0) 
return 0; 


if (Current token !- IN TOKEN) 
return 0; 
next token(); 


BaseAST *Body - expression parser(); 
if (Body -- 0) 


return 0; 


return new ExprForAST (IdName, Start, End, Step, Body); 
} 


5. 再 定义 Codegen0 函 数 生 成 LLVM IR: 


Value *ExprForAST::Codegen() { 
Value *StartVal = Start-»Codegen(); 
if (StartVal == 0) 
return 0; 


Function *TheFunction = Builder.GetInsertBlock()->getParent(); 
BasicBlock *PreheaderBB = Builder.GetInsertBlock(); 
BasicBlock *LoopBB = 

BasicBlock::Create(getGlobalContext(), "loop", TheFunction) 


Builder .CreateBr(LOopBB) ; 


Builder .SetInsertPoint(LOopBB) ; 

PHINode *Variable = Builder.CreatePHI(Type: :getInt32Ty(getGloba 
Context()), 2, Var Name.c str()); 

Variable->addIncoming(StartVal, PreheaderBB); 


Value *OldVal = Named Values[Var Name]; 
Named Values[Var Name] - Variable; 


if (Body->Codegen() == 0) 
return 0; 


Value *StepVal; 
if (Step) { 

StepVal = Step->Codegen(); 

if (StepVal == 0) 

return 0; 

) else ( 

StepVal - ConstantInt::get(Type::getInt32Ty(getGlobalConte 

xt()), 1); 

} 


Value *NextVar = Builder.CreateAdd(Variable, StepVal, 
"nextvar"); 


Value *EndCond = End-»Codegen(); 
if (EndCond -- 0) 
return EndCond; 


EndCond = Builder .CreateICmpNeE ( 
EndCond, ConstantInt::get(Type::getInt32Ty(getGlobalConte 
xt()), 0), "loopcond"); 
BasicBlock *LoopEndBB - Builder.GetInsertBlock(); 
BasicBlock *AfterBB - 
BasicBlock::Create(getGlobalContext(), "afterloop", 
TheFunction); 
Builder.CreateCondBr(EndCond, LoopBB, AfterBB); 
Builder.SetInsertPoint(AfterBB); 
Variable->addIncoming(NextVar, LoopEndBB); 
if (OldVal) 
Named Values[Var Name] - OldVal; 
else 
Named Values.erase(Var Name); 


return Constant: :getNullValue(Type: :getInt32Ty(getGlobalConte 
xt())); 
} 


“CHE RS 


执行 以 下 步 又。 


1. 编译 toy.cpp 文 件 : 


$ g++ -g toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs --libs core ~ -03 -o toy 


ZATIEN: 


$ vi example 


3. 在 样 例文 件 中 编写 以 下 包含 for 循 环 的 代码 : 


def printstar(n x) 
for i = 1, i< n, 1.0 in 
X +1 


4. HTOY 4a 282K a EE A: 


$ ./toy example 


5. 前 面 的 for 循 环 代码 会 生成 以 下 的 LLVM IR: 


; ModuleID = ‘my compiler’ 
target datalayout = “e-m: e-p:32:32-f64:32:64-f80:32-n8:16:32- 
$128” 


define i32 Qprintstar(i32 %n, 132 %x) { 
entry: 
br label $loop 


loop: ; preds = %loop, 
%entry 
%1 = phi i32 [1, %entry], [ %nextvar, %loop] 
ynextvar = add i32 %1, 1 
%cmptmp = icmp ult 132 %i, %n 
br i1 %cmptmp, label %loop, label %afterloop 


afterloop: ; preds = %loop 
Ret 132 0 
} 


解析 器 会 识别 循环 结构 ， 包 括 初 始 化 归纳 变量 、 终 止 条 件 ， 以 及 归 
纳 变量 的 步 长 值 和 循环 体 。 然 后 它 会 像 之 前 做 的 那样 ， 把 块 转 成 LLVM 
IR. 


之 前 已 经 提 到 ，phi 指 令 会 从 两 个 基本 块 %entry 和 %loop 得 到 变量 i 的 


两 个 值 。 在 之 前 的 例子 中 ，%entry 块 表示 在 循环 初始 化 时 对 i 赋值 为 1; 
而 %loop 块 对 i 的 值 进行 更 新 ， 完 成 循环 的 一 次 达 代 。 
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e 关于 Clang 是 如 何 实现 C++ 的 循环 结构 ， 请 参 
http://llvm.org/viewvc/llvm- 
project/cfe/trunk/lib/Parse/ParseExprCXX .cpp. 


Py — LAG Ay 
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用 户 自 定义 运算 符 和 C++ 中 运算 符 重 载 的 概念 相似 ， 一 个 默认 的 运 
算 符 被 修改 用 于 多 种 多 样 的 对 象 。 通 常 来 说 ， 运 算 符 会 是 一 元 或 者 二 元 
运算 符 。 在 现存 的 架构 下 实现 二 元 运算 符 是 相对 轻松 的 ， 但 一 元 运算 符 
需要 一 些 额外 的 代码 来 处 理 。 所 以 我 们 先 定义 二 元 运算 符 的 重 载 ， 之 后 
再 考虑 一 元 运算 符 的 重 载 。 


准备 工作 


自 定义 运算 符 的 第 一 步 是 定义 重 载 的 二 元 运算 符 ， 我 们 用 | (你 辑 或 
运算 符 ) 作为 样 例 ，TOY 语 言 中 的 | 运算 符 是 这 样 使 用 的 : 














def binary | (LHS RHS) 
if LHS then 

1 

else if RHS then 

1 


else 
0; 


从 这 段 代 码 可 以 看 出 ， 只 要 LHS 或 者 RHS 任 何 一 个 不 为 0， 那 么 就 
返回 1。 如 果 LHS 和 RHS 都 为 null， 则 返回 0。 


详细 步骤 
执行 以 下 步骤。 








ls 首先 像 往 常 一 样 ， 是 为 二 元 运算 符 增加 enum 类 型 ， 如 果 过 到 
binary 关 键 字 就 返回 相应 的 枚 举 类 型 : 





enum Token_Type { 


BINARY_TOKEN 


} 
static int get_token() { 


if (Identifier_string == "in") return IN_TOKEN; 
if (Identifier_string == "binary") return BINARY_TOKEN; 
} 


2. 然后 需要 为 其 增加 AST。 不 过 在 这 里 不 需要 定义 一 个 新 的 AST， 











JA ita SNE LPR AUS WI AST If E 处 理 。 不 过 ， 我 们 需要 为 其 增加 一 个 标 
识 来 表示 它 是 否 是 二 方 运算 符 。 如 果 是 运算 从， 再 确定 它 的 优先 级 : 





class FunctionDeclAST { 

std::string Func_Name; 

std::vector<std::string> Arguments; 

bool isOperator; 

unsigned Precedence; 
public: 

FunctionDeclAST(const std::string &name, const 
std::vector<std::string> &args, 

bool isoperator = false, unsigned prec = 0) 
Func Name(name), Arguments(args), isOperator(isoperator), 

Precedence(prec) {} 

bool isUnaryOp() const ( return isOperator && Arguments.size() 


char getOperatorName() const ( 
assert(isUnaryOp() || isBinaryOp()); 
return Func Name[Func Name.size() - 1]; 


j 


unsigned getBinaryPrecedence() const ( return Precedence; 


Function *Codegen(); 


}; 


3. 在 AST 修 改 好 之 后 ， 需 要 修改 函数 声明 的 解析 器 : 


static FunctionDeclAST *func_decl_parser() { 
std::string FnName; 


unsigned Kind = 0; 
unsigned BinaryPrecedence = 30; 


switch (Current_token) { 
default: 
return 0; 
case IDENTIFIER_TOKEN: 
FnName = Identifier_string; 
Kind = 0; 
next token(); 
break; 
case UNARY TOKEN: 
next token(); 
if (!isascii(Current token)) 


return 0; 
FnName = "unary"; 
FnName += (char)Current_token; 
Kind = 1; 
next_token(); 
break; 


case BINARY_TOKEN: 
next_token(); 
if (!isascii(Current_token) ) 


return 0; 
FnName = "binary"; 
FnName += (char)Current token; 
Kind = 2; 


next token(); 


if (Current token -- NUMERIC TOKEN) ( 
if (Numeric Val« 1 || Numeric Val » 100) 
return 0; 
BinaryPrecedence - (unsigned)Numeric Val; 
next token(); 
} 


break; 


} 


if (Current_token != '(') 
return 0; 


std: :vector<std::string> Function Argument Names; 


while (next token() -- IDENTIFIER TOKEN) 

Function Argument Names.push back(Identifier string); 
if (Current token !- ')') 

return 0; 


next token(); 


if (Kind && Function Argument Names.size() !- Kind) 
return 0; 


return new FunctionDeclAST(FnName, 
Function Argument Names, Kind !- 0, BinaryPrecedence); 


j 





4. 接着 修改 二 元 AST 的 Codegen0 函 数 : 


Value* BinaryAST::Codegen() { 

Value* L = LHS-»Codegen(); 

Value* R = RHS->Codegen(); 

switch(Bin Operator) { 

case '*' : return Builder.CreateAdd(L, R, "addtmp"); 

case '-' : return Builder.CreateSub(L, R, "subtmp"); 

case '*': return Builder.CreateMul(L, R, "multmp"); 

case '/': return Builder.CreateUDiv(L, R, "divtmp"); 

case '«' ; 

L - Builder.CreateICmpULT(L, R, "cmptmp"); 

return Builder.CreateUITOFP(L, Type::getIntTy(getGlobalContext()) 

"booltmp"); 

default 

break; 

} 

Function *F = TheModule->getFunction(std::string("binary")+0p); 
Value *Ops[2] = { L, R}; 
return Builder.CreateCall(F, Ops, "binop"); 

} 


5. 最 后 需要 修改 函数 声明 ， 定 义 如 下 : 


Function* FunctionDefnAST::Codegen() { 
Named Values.clear(); 
Function *TheFunction - Func Decl-»Codegen(); 
if (!TheFunction) return 0; 
if (Func Decl-»isBinaryOp()) 
Operator Precedence [Func_Decl->getOperatorName()] = Func_ 


Decl->getBinaryPrecedence(); 

BasicBlock *BB = BasicBlock::Create(getGlobalContext(), "entry", 

TheFunction); 

Builder.SetlInsertPoint(BB); 

if (Value* Return Value = Body->Codegen()) { 
Builder.CreateRet(Return Value); 


LEER 


执行 以 下 步 又 。 


1. 编译 toy.cpp 文 件 : 


$ g++ -g toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs --libs core ^ -03 -o toy 


2. 3 7FFEHRIC TE: 


$ vi example 


3. 在 样 例文 件 中 写 下 包含 二 元 运算 符 重 载 的 代码 : 





def binary| 5 (LHS RHS) 
if LHS then 
1 
else if RHS then 
1 
else 
0; 


4. 使 用 TOY 纺 译 器 来 编译 样 例文 件 : 


$ ./toy example 


output : 


; ModuleID = 'my compiler' 


target datalayout =  "e-m:e-p:32:32-f64:32:64-f80:32-n8:16:32- 
S128" 

define i32 @"binary|"(i32 *LHS, i32 %RHS) { 

entry: 


%ifcond = icmp eq i32 %LHS, 0 

%ifcondi = icmp eq i32 %RHS, 0 

%. = select i1 %ifcondi, i32 0, i32 1 
%iftmp5 = select i1 %ifcond, i32 %., i32 1 
ret 132 %iftmp5 


我 们 之 前 定义 的 二 元 运算 符 以 及 它 的 定义 会 被 解析 。 一 旦 遇 到 一 个 | 
二 元 运算 符 ， 会 初始 化 LHS 和 RHS， 并 且 执 行 其 函数 体 ， 按 定义 得 到 相 
应 的 结果 。 在 前 面 的 样 例 中 ， 只 要 LHS 和 RHS 中 的 任意 一 个 为 非 零 ， 结 
果 就 是 1， 如 果 LHS 和 RHS 都 是 0， 则 结果 是 0。 


为 请 参阅 


e 天 于 处 理 二 元 运算 符 的 详细 样 例 ， 请 参见 http:/Vlvm.org/docSs/ 
tutorial/LangImpl6.html . 


er y 一 一 Bete Ay 
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前 一 节 展 示 了 如 何 处 理 自 定 义 二 元 运算 符 ， 但 一 门 语 言 不 仅仅 有 二 


元 运算 符 ， 还 会 有 一 元 运算 符 ， 操 作 单 个 的 操作 数 。 本 节 介 绍 如 何 处 理 
一 元 运算 符 。 


准备 工作 





和 之 前 一 样 ， 需 要 先 在 TOY 语 言 中 定义 一 元 运算 符 ， 我 们 用 一 个 简 
单 的 ! (逻辑 非 ) 运算 符 作为 样 例 ， 其 定义 如 下 : 
def unary!(v) 

if v then 
9 
else 

1; 

如 果 变 量 v 的 值 是 真 ， 则 返回 0， 否 则 返回 1。 
AU Te HX 
iF R 

执行 以 下 步骤 。 





1. 首先 在 toy.cpp 文 件 中 为 一 元 运算 符 定义 enum token: 
enum Token_Type { 


BINARY_TOKEN, 
UNARY_TOKEN 
j 


2. 然后 识别 一 元 运算 符 字 符 串 ， 返 回 UNARY_TOKEN: 


static int get_token() { 


if (Identifier_string == "in") return IN_TOKEN; 

if (Identifier_string == "binary") return BINARY_TOKEN; 
if (Identifier string == "unary") return UNARY TOKEN; 

} 





3. 接着 为 一 元 运算 符 定 义 AST: 


class ExprUnaryAST : public BaseAST { 
char Opcode; 
BaseAST *Operand; 
public: 
ExprUnaryAST(char opcode, BaseAST *operand) 
: Opcode(opcode), Operand(operand) {} 
virtual Value *Codegen(); 


H 





4.ASTCAMA, BE7g— 208 EE XE XT RET RS: 


static BaseAST *unary parser() { 
if (!isascii(Current token) || Current token -- '(' || Current 
token == ',') 
return Base Parser(); 
int Op - Current token; 


next token(); 


if (EXprAST *Operand - unary parser()) 
return new ExprUnaryAST(Opc, Operand); 


return 0; 


I 
5. 下 一 步 是 在 二 元 运算 符 解析 器 中 调用 unary_parser() 函 数 : 


static BaseAST *binary op parser(int Old Prec, BaseAST *LHS) { 


while (1) ( 
int Operator Prec - getBinOpPrecedence(); 


if (Operator Prec« Old Prec) 
return LHS; 


int BinOp - Current token; 
next token(); 


BaseAST *RHS - unary parser(); 
if (!RHS) 
return 0; 


int Next Prec - getBinOpPrecedence(); 
if (Operator Prec« Next Prec) { 
RHS = binary op parser(Operator Prec + 1, RHS); 
if (RHS -- 0) 
return 0; 


j 


LHS - new BinaryAST(std::to string(BinOp), LHS, RHS); 


6. 现在 从 表达 式 解 析 器 中 调用 uanry_parser() 函 数 : 


static BaseAST *expression parser() { 
BaseAST *LHS = unary_parser(); 
if (!LHS) 
return 0; 


return binary op parser(0, LHS); 


j 
7. (ZRK BUS UT RU RET A : 


static FunctionDeclAST* func decl parser() ( 
std::string Function Name - Identifier string; 
unsigned Kind - 0; 
unsigned BinaryPrecedence - 30; 
switch (Current token) { 

default: 


return 0; 
case IDENTIFIER_TOKEN: 
Function_Name = Identifier_string; 
Kind = 0; 
next token(); 
break; 
case UNARY TOKEN: 
next token(); 
if (!isascii(Current token)) 
returnO; 
Function Name = "unary"; 
Function Name += (char)Current token; 
Kind = 1; 
next token(); 
break; 
case BINARY TOKEN: 
next token(); 
if (!isascii(Current token)) 


return 0; 
Function Name - "binary"; 
Function Name += (char)Current token; 
Kind - 2; 


next token(); 
if (Current token -- NUMERIC TOKEN) ( 
if (Numeric Val« 1 || Numeric Val » 100) 
return 0; 
BinaryPrecedence - (unsigned)Numeric Val; 
next token(); 


break; 
} 
if (Current_token ! = '(') { 
printf("error in function declaration"); 
return 0; 


j 


std::vector«std::string» Function Argument Names; 
while(next token() -- IDENTIFIER TOKEN) 
Function Argument Names.push back(Identifier string); 


if(Current token !- ')') 
printf("Expected')' "); 
return 0; 


next token(); 
if (Kind && Function Argument Names.size() !- Kind) 
return 0; 
return new FunctionDeclAST(Function Name, Function Arguments 
Names, Kind !=0, BinaryPrecedence); 


i 











8. BUR WEN 701s EAT XE X Codegen() PR: 


Value *ExprUnaryAST::Codegen() { 
Value *OperandV = Operand-»Codegen(); 
if (OperandV == 0) return 0; 


Function *F = TheModule-»getFunction(std::string("unary")-*Opco 
de); 


if (F == 0) 
return 0; 


return Builder.CreateCall(F, OperandV, "unop"); 


j 


CHE 


执行 以 下 步骤。 


1. 编译 toy.cpp 文 件 : 


$ g++ -g toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs --libs 
core ^ -03 -o toy 


2. 打开 样 例 文件 : 
$ vi example 
3. 在 样 例文 件 中 编写 包含 一 元 运算 符 重 载 的 代码 : 


def unary!(v) 
if v then 
0 


else 
1; 


4. 用 TOY 编 译 器 编译 样 例文 件 : 


$ ./toy example 


输出 如 下 : 


; ModuleID = 'my compiler' 
target datalayout = "e-m:e-p:32:32-f64:32:64-f80:32-n8:16:32- 
S128" 


define i32 @"unary!"(i32 %v) { 

entry: 
%ifcond = icmp eq i32 %v, 0 
%. = select i1 %ifcond, i32 1, i32 0 
ret 132 %. 

} 


用 户 定 义 的 一 元 运算 符 会 被 识别 、 解 析 ， 然 后 生成 IR。 对 于 这 个 例 
子 中 的 一 元 运算 符 ! ， 如 果 操 作 数 非 零 ， 那 么 结果 就 是 0， 否 则 是 1。 





为 请 参阅 


。 关于 一 元 运算 符 的 实现 细节 ， 请 参见 
http://llvm.org/docs/tutorial/LangImpl6.html . 


增加 JIT 支 持 


各 种 各 样 的 工具 可 用 于 LLVM IR。 如 第 1 章 所 示 ，IR 能 够 转 成 
bitcode 或 者 汇编 语言 。 一 个 叫 作 opt 的 优化 工具 也 能 作用 于 IR。 所 以 我 
们 通常 把 代理 解 为 一 个 通用 的 平台 一 一 这 些 工 具 的 抽象 层 。 


JITJ 文 持 也 能 在 IR 上 运行 。 它 能 立即 对 输入 的 顶级 表达 式 进 行 求 
值 ， 例 如 你 输入 了 1+2， 它 能 对 代码 求 值 并 输出 运算 结果 3。 


TA R 
执行 以 下 步 又。 


1. 在 toy.cpp 文 件 中 定义 一 个 执行 引擎 作为 全 局 静态 变量 : 
static ExecutionEngine *TheExecutionEngine; 

2. 在 toy.cpp 文 件 的 main0 函 数 中 增加 JIT 相 关 代 码 : 
int main() { 


init_precedence(); 
TheExecutionEngine = EngineBuilder(TheModule).create(); 


3. FEtoy.cpp EHF f PODER ZETA SAY RT d: 


static void HandleTopExpression() { 


if (FunctionDefAST *F - expression parser()) 
if (Function *LF = F->Codegen()) { 
LF -» dump(); 


void *FPtr = TheExecutionEngine- 
>getPointerToFunction(LF); 
int (*Int)() = (int (*)())(intptr t)FPtr; 
printf("Evaluated to %d\n", Int()); 


else 
next token(); 


LEER 


DUT UA PPS. 


1. 编译 toy.cpp 程 序 : 


$ gt+ -g toy.cpp ‘llvm-config --cxxflags --ldflags --system- 
libs --libs 
core mcjit native -03 -o toy 


2: 打开 样 例文 件 : 


$ vi example 


3. 在 样 例 文件 中 编写 以 下 TOY 人 代码: 
455; 
4. 最 后 ， 在 样 例文 件 中 运行 TOY 编 译 右 : 


$ ./toy example 


输出 如 下 。 


define i32 @0() { 
entry: 


ret i32 9 


LLVM 的 JIT 编 译 器 匹配 本 机 的 ABI 平 台 ， 它 会 把 得 到 的 指针 转 成 相 
应 类 型 的 函数 指针 ， 然 后 直接 调用 。JIT 编 译 得 到 的 代码 与 静态 编译 链 
接 的 本 地 机 器 码 没 有 区 别 。 





[LUJIT: Just-In-Time， 即 时 编译 ， 在 程序 运行 时 将 代码 翻译 成 机 器 
码 并 执行 。 与 之 相对 的 是 AOT (Ahead Of Time) ， 它 在 程序 运行 之 前 
就 将 代码 编译 成 机 器 码 。JIT 结 合 了 AOT 和 解释 执行 的 优势 ， 它 能 够 产 
生 高 效 的 机 器 码 ， 并 具备 足够 的 灵活 性 。 一 一 译 者 注 


第 4 章 ”人 准备 优化 
本 章 涵 盖 以 下 话题 。 


。 多 级 优化 

e Fixe XLLVM Pass 

e 使 用 opt 工 具 运 行 自 定义 Pass 
e 在 新 的 Pass 中 调用 其 他 Pass 
e 使 用 Pass 管 理 器 注册 Pass 

。 实现 一 个 分 析 Pass 

。 实现 一 个 别名 分 析 Pass 

e 使 用 其 他 分 析 Pass 


概述 


在 完成 对 源码 的 转换 之 后 ， 束 会 得 到 LLVM IR 形 式 的 输出 ， 它 作为 
问 汇 编 代 码 转 换 的 一 个 公共 平台 ， 依 赖 不 同 的 后 端 得 到 不 同 的 汇编 码 。 
在 转 为 汇编 码 之 前 ， 如 果 对 了 及 进行 优化 就 可 以 得 到 执行 效率 更 高 的 代 
码 。LLVM IR 是 基于 SSA 形 式 的 ， 这 也 就 意味 着 对 每 个 变量 的 赋值 都 会 
re 或 者 说 变量 是 不 可 变 的 ， 这 是 SSA 表 示 的 一 种 经 典 
半 例 o 


在 LLVM 的 架构 中 ，Pass 的 作用 是 优化 LLVM IR。Pass 作 用 于 
LLVM IR， 处 理 IR， 分 析 IR， 寻 找 优 化 的 机 会 并 修改 TR 产生 优化 的 代 
码 。 命 令 行 工具 opt 就 是 用 来 在 LLVM IR 上 运行 各 种 优化 Pass 的 。 


接 下 来 的 章节 中 会 讨论 多 种 优化 技术 ， 也 包括 如 何 编写 和 注册 一 个 
新 的 优化 Pass。 























多 级 优化 


通常 编译 占 的 优化 会 有 多 种 级 别 ， 从 0 一 3 也 有 s 通 第 用 作 空 间 优 
a PSU 代码 得 到 的 优化 也 越 多 。 让 我 们 来 看 看 不 同 的 优 
级 别 。 


准备 工作 


通过 在 LLVM ”IR 上 运行 opt 命 令 行 工 具 可 以 帮助 理解 不 同 的 优化 级 
别 。 在 此 之 前 我 们 先 使 用 Clang 前 端 将 C 样 例 程 序 转 换 为 IR。 


1. 打开 example.c 文 件 ， 编 写 以 下 代码 : 


$ vi example.c 
int main(int argc, char **argv) { 
int i, j, k, t = 0; 
for(i = 0; i< 10; i++) { 
for(j = 0; j< 10; j++) { 
for(k = 0; k< 10; k++) { 
trt; 
} 
} 
for(j = 0; j< 10; j++) { 
tt++; 


j 


for(i = 0; i< 20; i++) { 
for(j = 0; j< 20; j++) { 
t++; 
} 
for(j = 0; j< 20; j++) { 
t++; 


j 


return t; 


2. 然后 用 Clang 命 令 把 源码 转 成 LLVM IR: 


$ clang -S -00 -emit-llvm example.c 


会 生成 一 个 包含 LLVM ”IR 的 example.ll 新 文件 ， 它 将 用 作 展 示 多 种 
可 用 的 优化 级 别 。 


详细 步骤 
执行 以 下 步 又。 


1. 使 用 opt 命 令 行 工 具 优 化 包含 生成 I[R 的 example.l1 文 件 : 


$ opt -00 -S example.11 
-O00 表示 最 低 的 优化 级 别 。 
2. 类 似 地 ， 你 可 以 尝试 其 他 优化 级 别 : 


$ opt -01 -S example.11 
$ opt -02 -S example.11 
$ opt -03 -S example.11 


aE 


opt 命 令 行 工 具 使 用 example.1 文件 作为 输入 ， 运 行 优 化 级 别 对 应 的 
一 系列 Pass。 它 也 能 在 同一 个 优化 级 别 重复 运行 一 些 Pass。 如 果 你 需要 
看 在 每 一 个 优化 级 别 运 行 了 哪些 Pass， 只 需要 为 之 前 的 opt 命 令 增 加 -- 
debug-pass=Structure 命 令 行 选项 。 
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。 天 于 opt 工 具 能 够 使 用 的 更 多 其 他 选项 ， 请 参见 
http://llvm.org/docs/CommandGuide/opt.html . 


HE X LLVM Pass 


LLVM 实 现 了 一 系列 的 分 析 和 转换 Pass， 所 有 的 LLVM Pass 都 是 pass 
类 的 子 类 ， 并 且 通 过 覆 写 了 从 pass 类 继承 的 虚 函 数 以 实现 其 功能 。 任 何 
一 个 Pass 都 是 Pass LLVM 的 实例 。 


准备 工作 


让 我 们 来 看 看 如 何 自己 写 一 个 Pass。 我 们 把 自己 的 Pass 命 名 为 
function block counter， 运 行 时 它 会 识别 展示 函数 名 ， 以 及 对 函数 中 的 基 
本 块 进行 计数 。 首 先 我 们 需要 为 这 个 Pass 编 写 一 个 Makefile， 来 构建 
Pass。 执 行 以 下 步骤 ， 编 写 Makefile: 








1. 在 llvm lib/Transform 目录 下 打开 Makefile 文 件 : 


$ vi Makefile 


2. 在 Makefile 中 指定 LLVM 根 目录 的 路 径 、 库 的 名 字 ， 标 识 模块 为 
可 加 载 ， 如 下 : 





LEVEL = ../../.. 
LIBRARYNAME = FuncBlockCount 
LOADABLE_MODULE = 1 
include $(LEVEL)/Makefile.common 
这 个 Makefile 指 定 了 当前 目录 的 所 有 .cpp 文 件 都 将 被 编译 并 链接 成 
为 一 个 动态 链接 库 。 


详细 步 又 


执行 以 下 步 又。 


1. 创建 一 个 名 为 FuncBlockCount.cpp 的 .cpp 文 件 : 


$ vi FuncBlockCount.cpp 


2. 在 文件 中 引入 LLVM 的 一 些 头 文件 : 


#include "llvm/Pass.h" 
#include "llvm/IR/Function.h" 
#include "llvm/Support/raw_ostream.h" 


3. 引入 llvm 命 名 空间 ， 以 使 用 其 中 的 LLVM 函 数 : 


using namespace llvm; 


4. 创建 一 个 匿名 的 命名 空间 : 


namespace { 


5. 然后 声明 Pass: 


struct FuncBlockCount : public FunctionPass { 


6. 声明 Pass 标 识 符 ， 会 被 LLVM 用 作 识 别 Pass: 


static char ID; 
FuncBlockCount() : FunctionPass(ID) {} 





7. Xen 5j Passi E BEA 2 7 clon esi A, [A] Ai Pass 
作用 于 函数 并 有 旦 继承 了 FunctionPass 类 ， 因 此 定义 runOnFunction 孙 数 ， 
在 函数 上 运行 : 


bool runOnFunction(Function &F) override { 
errs()<< "Function "<< F.getName()«« '^n'; 
return false; 
} 
}; 
上 


函数 会 输出 当前 处 理 的 函数 名 。 
8. 接 下 来 初始 化 Pass ID: 


char FuncBlockCount::ID = 0; 


9. 最 后 ， 需 要 注册 Pass， 填 写 名 称 、 命 令 行 参 数 : 


static RegisterPass<FuncBlockCount> X("funcblockcount", "Function 
Count", false, false); 


所 有 代码 都 完成 之 后 ， 会 像 这 样 : 


#include "llvm/Pass.h" 
#include "llvm/IR/Function.h" 
#include "llvm/Support/raw ostream.h" 
using namespace llvm; 
namespace ( 
struct FuncBlockCount : public FunctionPass { 
static char ID; 
FuncBlockCount() : FunctionPass(ID) {} 
bool runOnFunction(Function &F) override { 
errs()«« "Function "<< F.getName()<< '^n'; 
return false; 


u 


char FuncBlockCount::ID - 0; 
static RegisterPass«FuncBlockCount» X("funcblockcount", 
"Function Block Count", false, false); 
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只 需要 简单 地 使 用 gmake 命 令 就 能 编译 这 个 文件 ， 然 后 在 LLVM 根 
目录 会 得 到 一 个 新 文件 FuncBlockCount.so。 这 个 动态 链接 库 文 件 能 够 动 
态 加 载 到 opt 工 具 ， 然 后 在 LLVM IR 代 码 上 运行 。 至 于 如 何 加 载 并 运 
行 ， 会 在 下 一 节 展 示 。 


j 
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e T Uy ASERMJEE—-^-Pass, i82 Whttp://Ilvm.org/docs/Writing 
AnLLVMPass.html. 


使 用 opt 工 具 运 行 目 定义 Pass 


前 一 节 编 写 的 Pass 已 经 准备 好 在 LLVM IR 上 运行 了 ， 只 需要 使 用 opt 
工具 动态 加 载 这 个 Pass， 即 可 识别 并 运行 。 





详细 步骤 
执行 以 下 步骤。 





1. 在 sample.c 文 件 中 编写 C 语 言 测 试 代 码 ， 之 后 会 被 编译 为 .1 文件 : 


$ vi sample.c 


int foo(int n, int m) { 

int sum = 0; 

int cO; 

for (cO = n; cO > 0; cO--) { 
int c1 = m; 
for (; c1 > 0; c1--) d 

sum += CO > c1 ? 1:90; 

} 

} 

return sum; 


2. 使 用 以 下 命令 将 C 语 言 测 试 代码 编译 为 LLVM IR: 


$ clang -00 -S -emit-llvm sample.c -o sample.11 
会 生成 sample.1 文件 。 
3. 使 用 opt 工 具 运 行 新 的 Pass， 如 下 : 


$ opt -load (path_to_.so_file)/FuncBlockCount.so -funcblockcount 
sample.ll 


输出 如 下 : 


Function foo 


LEER 


从 之 前 的 代码 可 以 看 到 ，opt 命 令 行 工具 会 动态 加 载 动 态 链接 库 ， 
以 运行 Pass。 之 后 Pass 会 融 历 每 一 个 函数 ， 输 出 其 函数 名 ， 但 未 对 IR 做 
任何 改动 。 在 下 一 节 会 展示 在 新 的 Pass 中 如 何 对 IR 做 进一步 增强 。 
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e 关于 多 种 类 型 的 Pass 类 ， 请 参见 
http://Ilvm.org/docs/Writing AnLLVMPass.html#pass-classes-and- 
requirements 。 


在 新 的 Pass 中 调用 其 他 Pass 


一 个 Pass 可 能 会 需要 其 他 Pass 以 得 到 分 析 数 据 、 启 发 或 类 似 信息 来 
指导 自己 的 行为 。 例 如 ， 一 个 Pass 可 能 会 需要 一 些 对 内 存 依赖 性 的 分 
析 ， 或 者 需要 修改 过 的 了 及 。 我 们 在 前 一 节 编 号 的 Pass 仅 仅 是 输出 了 函数 
名 ， 本 节 我 们 会 对 其 增强 ， 使 它 能 够 对 循环 中 的 基本 块 进行 计数 ， 以 介 
绍 如 何 使 用 其 他 Pass 的 结果 。 


准备 工作 


前 一 市 编写 的 代码 基本 不 变 ， 不 过 还 需要 男 外 做 一 些 改动 以 进行 增 
强 ， 使 得 它 能 够 在 这 个 IR 中 对 基本 块 进行 计数 ， 在 下 面 将 进行 展示 。 


Vv. te 
评 细 步 桑 
getAnalysis 函 数 用 于 指定 要 使 用 的 其 他 Pass。 


1， 既 然 我 们 实现 的 Pass 要 对 基本 块 进行 计数 ， 那 么 它 就 需要 函数 的 
循环 信息 ， 可 以 通过 getAnalysis 循环 函数 指定 : 








LoopInfo *LI = &getAnalysis<LoopInfoWrapperPass>().getLoopiInfo(); 


2， 上 面 的 代码 会 调用 LoopInfoPass 来 得 到 关于 循环 的 信息 ， 通 过 对 
这 个 对 象 的 兴 代 即 可 得 到 基本 块 信息 : 


unsigned num_Blocks = 0; 
Loop: :block_iterator bb; 
for(bb = L->block_begin(); bb != L->block_end();++bb) 
num_Blocks++; 
errs()<< "Loop level "<< nest<< " has "<< num_Blocks 
<< " blocks\n"; 





3. 以 上 代码 会 遍历 循环 ， 对 其 中 的 基本 块 进 行 计数 。 但 它 只 对 最 外 
层 循环 中 的 基本 闫 计 煞 如 果 想 要 得 到 内 层 循环 的 信息 ， 还 需要 递归 地 
eee ees TEXZ FE ACE FY PRIA, FA a eV 
地 调用 会 更 有 意义 





void countBlocksInLoop(Loop *L, unsigned nest) { 
unsigned num_Blocks = 0; 
Loop: :block_iterator bb; 
for(bb = L->block_begin(); bb != L->block_end();++bb) 
num_Blocks++; 
errs()<< "Loop level "<< nest<< " has "<< num_Blocks 
<< " blocks\n"; 
std: :vector<Loop*> subLoops = L->getSubLoops(); 
Loop::iterator j, f; 
for (j = subLoops.begin(), f = subLoops.end(); j != f; 
++j) 
countBlocksInLoop(*j, nest + 1); 
J 


virtual bool runOnFunction(Function &F) { 
LoopInfo *LI = &getAnalysis«LoopInfoWrapperPass»(). 
getLoopInfo(); 
errs()«« "Function "<< F.getName() + "An"; 
for (Loop *L : *LI) 
countBlocksInLoop(L, 0); 
return false; 


j 
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我 们 在 样 例 程序 上 运行 新 修改 的 Pass， 执 行 以 下 步骤 来 修改 并 运行 
样 例 程 序 。 


1. 打开 sample.c 文 件 ， 用 以 下 代码 来 奉 换 其 内 容 : 





int main(int argc, char **argv) { 
int i, j, k, t = 0; 
for(i = 0; i« 10; I++) ( 
for(j = 0; j< 10; j++) { 


for(k = 0; k< 10; k++) { 
ttt; 
} 


} 
for(j 
tt++; 
} 
} 
for(i = 0; i< 20; i++) { 
for(j = 0; j« 20; j**) { 
trt; 
} 
for(j 
七 + 十 
} 
} 


return t; 


0; j< 10; j++) ( 


0; j< 20; j++) ( 


) 
2. 用 Clang 将 其 转换 成 .1 文件 : 


$ clang -00 -S -emit-llvm sample.c -o Sample.11 


3. 在 样 例 代码 上 运行 新 的 Pass: 


$ opt -load (path_to_.so_file)/FuncBlockCount.so -funcblockcount 
sample.11 


输出 如 下 : 


Function main 

Loop level 0 has 11 blocks 
Loop level 1 has 3 blocks 
Loop level 1 has 3 blocks 
Loop level 0 has 15 blocks 
Loop level 1 has 7 blocks 
Loop level 2 has 3 blocks 
Loop level 1 has 3 blocks 


更 多 内 容 


LLVMHJ Pass E Earje Hk f Passa wie, DUC 1860578 41] 
的 Pass 使 用 了 哪些 分 机 和 优化 ， 如 下 : 


$ opt -load (path to .so file)/FuncBlockCount.so 


funcblockcount sample.11 - 
disable-output -debug-pass-Structure 


使 用 Pass 管 理 器 注册 Pass 


到 目前 为 止 ， 每 个 Pass 都 是 独立 运行 的 动态 链接 库 文 件 ， 而 opt 工 具 
是 由 一 系列 这 样 的 Pass 通 过 Pass 管 理 器 注册 组 成 的 ， 作 为 LLVM 的 一 部 
分 。 本 节 将 展示 用 Pass 管 理 器 注册 Pass 的 详细 步骤 。 


准备 工作 


PassManager 个 类 会 接受 一 个 Pass 列 表 ， 并 且 保 证 它们 的 先决 条 件 正 
确 设置 ， 之 后 会 对 它们 进行 调度 以 保证 高 效 运 行 。Pass 管 理 器 为 了 减少 
一 系列 Pass 的 执行 时 间 ， 主 要 负责 以 下 两 个 任务 。 








。 尽 可 能 在 多 个 Pass 间 共 孚 分 析 数 据 ， 避 免 重复 计算 分 析 结果 。 
© 使 得 Pass 执 行 流 水 线 化 ， 一 系列 Pass 一 起 流水 线 化 运行 ， 以 达到 组 
存 和 内 存 使 用 行为 友好 。 


详细 步 又 


执行 以 下 步骤 使 用 Pass 管 理 器 注册 Pass。 

1. 在 FuncBlockCount.cpp 文 件 中 定义 DEBUG_TYPE 宏 ， 指 定 调试 名 
称 : 
#define DEBUG_TYPE "func-block-count" 


2. 在 FuncBlockCount 结 构 体 中 指定 getAnalysisUsage 语 法 : 


void getAnalysisUsage(AnalysisUsage &AU) const override { 
AU.addRequired<LoopInfoWrapperPass>(); 
} 


3. 初始 化 宏 ， 以 初始 化 新 的 Pass: 


INITIALIZE PASS BEGIN(FuncBlockCount, " funcblockcount ", 
"Function Block Count", false, false) 
INITIALIZE PASS DEPENDENCY(LoopInfoWrapperPass) 


INITIALIZE PASS END(FuncBlockCount, "funcblockcount", 

"Function Block Count", false, false) 
Pass *llvm::createFuncBlockCountPass() ( return new 
FuncBlockCount(); ) 


4. dfinclude/llvm/LinkAllPasses.h X. f HH 7sJ]licreateFuncBlockCount 
Pass PA AX: 


(void) llvm:: createFuncBlockCountPass (); 





5. 在 include/llvm/Transforms/Scalar.h 文 件 中 添加 声明 : 


Pass * createFuncBlockCountPass (); 


6. 修改 Pass 的 构造 函数 : 


FuncBlockCount() : FunctionPass(ID) {initializeFuncBlockCount 
Pass(*PassRegistry::getPassRegistry());) 


7. fElib/Transforms/Scalar/Scalar.cpp X- fF F 35279] 48 44 PassH'] & H : 


initializeFuncBlockCountPass (Registry); 


8. 在 include/llvm/InitializePassed.h 文 件 中 添加 初始 化 声明 : 


void initializeFuncBlockCountPass (Registry); 


9. 在 lib/Transforms/Scalar/CMakeLists.text 文 件 中 添加 FuncBlock- 
Count.cpp 文 件 名 : 


FuncBlockCount.cpp 


CER 


参照 第 1 章 的 方法 ， 使 用 cmake 命 令 编译 LLVM，Pass 管 理 器 会 在 opt 
行 工 具 的 Pass 流 水 线 中 包含 新 加 入 的 Pass。 同 样 ， 这 个 Pass 也 能 在 


it 
命令 行 独立 运行 : 


$ opt -funcblockcount sample.11 


e 关于 如 何 简 单 地 在 Pass 管 理 器 中 添加 Pass， 请 参见 LoopInstSimplify 
Pass: http://Ilvm.org/viewvc/llvm- 
project/llvm/trunk/lib/Transforms/Scalar/LoopInstSimplify.cpp. 


实现 一 个 分 析 Pass 


分 析 Pass 在 实际 不 修改 琢 的 情况 下 提供 关于 IR 的 更 高 级 信息 ， 而 这 
些 信 息 可 以 被 其 他 的 分 析 Pass 使 用 来 计算 其 结果 。 并 且 ， 只 要 一 个 分 析 
Pass 计 算出 了 结果 ， 这 个 计算 结果 可 以 被 不 同 的 Pass 多 次 使 用 ， 直 到 一 
个 Pass 改 变 了 这 个 IR。 本 节 将 实现 一 个 分 析 Pass， 来 计算 并 输出 一 个 因 
数 中 使 用 的 操作 码 的 数量 。 


准备 工作 
首先 ， 为 我 们 的 Pass 编 写 测试 代码 : 


$ cat testcode.c 
int func(int a, int b)( 
int sum - 0; 
int iter; 
for (iter = 0; iter< a; iter++) { 
int iter1; 
for (iteri1 = 0; iteri« b; iteri-*-) { 
sum += iter > iter1? 1: 0; 
} 
} 


return sum; 


将 它 转 换 为 .bc 文件 ， 作 为 分 析 Pass 的 输入 : 


$ clang -c -emit-llvm testcode.c -o testcode.bc 


|^ Ja CEllvm_root_dir/lib/Transforms/opcodeCounter H KELE £4 Pass 
源码 的 文件 ， 这 里 的 opcodeCounter 是 我 们 创建 的 目录 ， 之 后 Pass 的 源码 
都 会 存在 这 里 。 


参照 之 前 的 做 法 ， 为 这 个 目录 创建 一 个 Makefile 并 做 必要 修改 ， 以 
编译 Pass。 


详细 步 又 


现在 开始 编写 分 析 Pass 的 源码 。 
1. 包含 必要 的 头 文件 ， 并 使 用 lvm 命 名 空间 : 





#define DEBUG_TYPE "opcodeCounter" 
#include "llvm/Pass.h" 

#include "llvm/IR/Function.h" 
#include "llvm/Support/raw ostream.h" 
#include<map> 

using namespace llvm; 


2. AyPass ze X. CountOpcode£Z T4 4 : 


namespace ( 
struct CountOpcode: public FunctionPass { 


3. 在 结构 体 中 创建 必要 的 数据 结构 ， 来 计算 操作 码 的 数量 ， 以 及 表 
示 Pass 的 Pass ID: 


std::map« std::string, int» opcodeCounter; 
static char ID; 
CountOpcode () : FunctionPass(ID) {} 





4. 在 前 面 定 义 的 结构 体 中 ， 编 写 Pass 的 具体 实现 代码 ， 堆 写 
runOnFunction PF 2": 


virtual bool runOnFunction (Function &F) ( 
llvm::outs() << "Function " << F.getName () << '\n'; 
for ( Function::iterator bb = F.begin(), e = F.end(); bb != 
e; ++bb) { 
for ( BasicBlock::iterator i = bb->begin(), e = bb->end(); 
i!- e; ++i) { 
if (opcodeCounter .find(i->getOpcodeName()) == 
opcodeCounter.end()) ( 
opcodeCounter[i->getOpcodeName()] = 1; 
) else { 


opcodeCounter[i->getOpcodeName()] += 1; 
} 
} 
} 


std::map< std::string, int>::iterator i 
opcodeCounter.begin(); 
std::map« std::string, int»::iterator e - 
opcodeCounter.end(); 
while (i !=e) { 
llvm::outs() << i->first << ": " << i->second << "An"; 
i++; 


llvm::outs() << "An"; 
opcodeCounter.clear(); 
return false; 

} 

}; 

} 


5. 编写 代码 注册 Pass: 


char CountOpcode::ID = 0; 
static RegisterPass<CountOpcode> X("opcodeCounter", "Count 
number of opcode in a functions"); 


6. 用 make 或 者 cmake 命 令 编 译 Pass。 


-— ur oe ee eon 得 到 函数 中 使 用 的 操作 码 的 
里 . ak: 


$ opt -load path-to-build-folder/lib/LLVMCountopcodes.so 
-opcodeCounter -disable-output testcode.bc 
Function func 

add: 3 

alloca: 5 

br: 8 

icmp: 3 

load: 10 

ret: 1 

select: 1 

store: 8 
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这 个 分 析 Pass 在 函数 层级 上 运行 ， 作 用 于 程序 中 的 每 一 个 函数 。 
此 ， 我 们 在 声明 CountOpcodes : public FunctionPass 结 构 的 时 候 继 承 了 
FunctionPass PK 2 . 


opcodeCounter 函 数 保存 函数 中 使 用 的 每 个 操作 码 的 数量 。 在 下 面 的 
for 循 环 中 ， 遇 历 所 有 函数 中 的 操作 码 : 


for (Function::iterator bb = F.begin(), e = F.end(); bb != e; 
++bb) ( 

for (BasicBlock::iterator i = bb->begin(), e = bb->end(); i !- e; 
++i) { 
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4i— AR HEA 
条 指令 。 


第 1 层 for 循 环 中 的 代码 实际 收集 操作 码 并 且 计数 ， 而 循环 之 后 的 一 
段 代 码 则 输出 结果 。 由 于 我 们 使 用 map 来 存储 结果 ， 所 以 只 需要 在 函数 
中 遍历 这 个 map， 然 后 输出 每 一 对 操作 码 的 名 字 以 及 计数 。 


由 于 函数 没有 修改 测试 代码 中 的 任何 东西 ， 所 以 返回 false。 最 后 两 
行 代码 用 于 以 给 定 的 名 字 注 册 Pass 以 便 在 opt 工 具 中 可 以 使 用 这 个 Pass。 


最 后 ， 在 测试 代码 上 执行 ， 世 能 够 得 到 函数 中 不 同 的 操作 码 输出 和 
使 用 次 数 了 。 








实现 一 个 别名 分 析 Pass 


旨 针 别名 分 析 CAlias Analysis) 用 于 判断 是 否 存在 两 个 指针 指 回 同 
一 个 地 方 ， 换 言 之 ， 是 否 存在 一 个 地 址 被 不 同 的 指针 使 用 。 基 于 别名 分 
析 的 结果 ， 可 以 进行 进一步 优化 ， 例 如 公共 子 表达 式 消除 。 有 许多 方法 
和 算法 可 以 进行 别名 分 析 。 本 节 不 会 讲述 这 些 算法 ， 而 是 会 展示 LLVM 
如 何 为 你 提供 一 些 基 础 设施 ， 以 编写 我 们 上 自己 的 别名 分 析 Pass。 本 市 会 
编写 别名 分 析 的 Pass 来 展示 如 何 开始 编写 这 样 的 Pass， 不 会 使 用 特定 的 
算法 ， 而 是 在 每 个 分 析 的 实例 中 返回 MustAlias 作 为 输出 。 


准备 工作 


首先 编写 测试 代码 以 作为 别名 分 析 的 输入 ， 在 这 里 我 们 采用 前 面 章 
节 的 testcode.c 文 件 作为 测试 代码 。 


当然 ， 你 还 需要 修改 Makefile， 为 llvnylib/Analysis/Analysis.cpp、 
Ilvm/ include/llvm/InitializePasses.h. Ilvm/include/llvm/LinkAll Passes.h、 
llvnyinclude/llvm/Analysis/Passes.h 中 的 Pass 增 加 条 目 以 注册 Pass， 在 
llvm_source_dir/lib/Analysis/ 目 录 创 建 Everything MustAlias.cpp 文 件 ， 其 
中 包含 Pass 的 源码 。 











详细 步骤 
执行 以 下 步 又。 


1. 引入 必要 的 头 文件 ， 使 用 lvm 命 名 空间 : 


#include "llvm/Pass.h" 

#include "llvm/Analysis/AliasAnalysis.h" 
#include "llvm/IR/DataLayout.h" 

#include "llvm/IR/LLVMContext.h" 


#include "llvm/IR/Module.h" 
using namespace llvm; 


2. 通过 继承 ImmutablePass 和 AliasAnalysis 类 为 Pass 创 建 一 个 结构 : 


namespace { 
struct EverythingMustAlias : public ImmutablePass, public 
AliasAnalysis { 


3. 声明 相应 的 数据 结构 和 构造 函数 : 


static char ID; 
EverythingMustAlias() : ImmutablePass(ID) {} 
initializeEverythingMustAliasPass(*PassRegistry: :getPassRegist 


ry());3 


4. 实现 getAdjustedAnalysisPointer 函 数 : 


void *getAdjustedAnalysisPointer(const void *ID) override { 
if (ID == &AliasAnalysis::ID) 
return (AliasAnalysis*)this; 
return this; 


} 
5. 实现 initializePass 函 数 来 初始 化 Pass: 


bool doInitialization(Module &M) override { 
DL = &M.getDataLayout(); 
return true; 


} 
6. 实现 alias 函 数 : 


void *getAdjustedAnalysisPointer(const void *ID) override { 
if (ID == &AliasAnalysis::ID) 
return (AliasAnalysis*)this; 
return this; 
} 
}; 
} 


7. 注册 Pass: 


char EverythingMustAlias::ID = 0; 
INITIALIZE AG PASS(EverythingMustAlias, AliasAnalysis, "must-aa", 
"Everything Alias (always returns 'must' alias)", true, true, 
true) 


ImmutablePass *llvm::createEverythingMustAliasPass() { return new 
EverythingMustAlias(); } 


8. 使 用 make 或 者 cmake 命 令 编译 Pass。 


9. 在 编译 Pass 得 到 .so 文件 之 后 ， 使 用 该 文件 执行 测试 代码 : 


$ opt-must-aa -aa-eval -disable-output testcode.bc 
===== Alias Analysis Evaluator Report ===== 

10 Total Alias Queries Performed 

0 no alias responses (0.0%) 

0 may alias responses (0.0%) 

0 partial alias responses (0.0%) 

10 must alias responses (100.0%) 

Alias Analysis Evaluator Pointer Alias Summary: 

0?6/ 0?6/ 0?6/ 10 096 

Alias Analysis Mod/Ref Evaluator Summary: no mod/ref! 


LEER 


AliasAnalysis 类 定义 了 多 种 别名 分 析 实 现 所 支持 的 接口 ， 它 导出 了 
AliasResult 和 ModRefResult 枚 举 类 型 ， 分 别 表示 alias 和 modref 查 询 的 结 
果 。 


alias 方 法 用 于 检查 两 个 内 存 对 象 是 否 指 向 相同 的 地 址 。 它 以 两 个 内 
存 对 象 为 输入 ， 相 应 地 返回 MustAlias、PartialAlias、MayAlias 或 者 
NoAlias 。 


getModRefInfo 方 法 返回 一 条 指令 的 执行 是 否 读 取 或 者 修改 内 存 位 
置 的 信息 。 前 面 样 例 中 的 Pass 对 于 每 两 个 指针 都 会 返回 MustAlias， 正 如 
我 们 所 实现 的 一 样 。 前 面 的 类 继承 ImmutablePasses 类 ， 适 合 我 们 的 


Pass， 这 是 一 个 很 基本 的 Pass。 而 继承 AliasAnalysisPass， 则 因为 它 为 我 
们 的 实现 提供 了 接口 。 


getAdjustedAnalysisPointer 疯 数 用 作 和 多 继承 场景 下 一 个 实现 分 析 接 
口 的 Pass。 如 果 有 必要 ， 它 应 当 窗 写 基 类 的 虚 函 数 ， 对 指针 进行 转型 以 
提供 特定 Pass 的 信息 。 


initializePass 函 数 则 用 于 初始 化 含有 InitializeAliasAnalysis 方 法 的 
Pass， 这 个 函数 会 包含 别名 分 析 的 具体 实现 。 


getAnalysisUsage 方 法 用 于 声明 此 Pass 对 其 他 Pass 的 依赖 ， 这 通过 显 
式 地 调用 AliasAnalysis::getAnalysisUsage 方 法 来 实现 。 


alias 方 法 之 后 的 代码 用 作 注 册 Pass。 最 后 测试 的 时 候 ， 我 们 得 到 了 
10 个 MustAlias 啊 应 (100.0%) 的 结果 ， 正 如 我 们 在 Pass 中 所 实现 的 。 
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e 关于 LLVM 中 别名 分 析 的 详细 信息 ， 请 参见 
http://lvm.org/docs/AliasAnalysis.html。 


使 用 其 他 分 析 Pass 


本 节 将 简要 介绍 LLVM 提 供 的 其 他 分 析 Pass， 它 们 可 用 作 分 析 基 本 
块 、 函 数 、 横 块 等 信息 。 除 此 之 外 ， 还 将 展示 LLVM 已 经 实现 的 Pass， 
使 用 这 些 Pass 来 进行 其 他 分 析 。 但 本 节 仅 仅 介 绍 一 部 分 Pass， 
并 非 所 有 。 


准备 工作 
首先 在 testcodel.c 文 件 中 编写 测试 代码 ， 用 作 分 析 ; 


$ cat testcode1.c 

void func() { 

int i; 

char C[2]; 

char A[10]; 

for(i = 0; i !- 10; ++i) ( 
((short*)c)[0] = A[1i]; 
C[1] = A[9-i]; 


Www 


使 用 以 下 命令 行 ， 把 C 语 言 代 码 转换 成 bitcode 格 式 : 


$ clang -c -emit-llvm testcode1.c -o testcode1.bc 


TEA Ux 
执行 以 下 步骤 使 用 其 他 分 析 Pass。 
1. 使 用 -aa-eval 命 令 行 选 项 调用 opt 工 具 ， 执 行 别名 分 析 评 佑 器 


Pass: 


$ opt -aa-eval -disable-output testcode1.bc 

===== Alias Analysis Evaluator Report ===== 

36 Total Alias Queries Performed 

0 no alias responses (0.0%) 

36 may alias responses (100.0%) 

O partial alias responses (0.0%) 

0 must alias responses (0.0%) 

Alias Analysis Evaluator Pointer Alias Summary: 0%/100%/0%/0% 
Alias Analysis Mod/Ref Evaluator Summary: no mod/ref! 


2. 使 用 -print-dom-info 命 令 行 选 项 调用 opt 工 具 ， 打 印 文 配 者 树 


Cdominator-tree) : 


Inorder Dominator Tree: 
[1] %0 {0,9} 
[2] %1 (1,8) 
[3] %4 {2,5} 
[4] %19 {3,4} 
[3] %22 {6,7} 


3.， 使 用 -count-aa 命 令 行 选项 调用 opt 工 具 ， 对 一 个 Pass 同 其 他 Pass 的 
别名 分 析 查 询 进 行 计数 : 


$ opt -count-aa -basicaa -licm -disable-output testcode1.bc 


No alias: [4B] 132* *i, [1B] i8* %7 

No alias: [4B] i32* %i, [2B] i16* %12 

No alias: [1B] i8* %7, [2B] i16* %12 

No alias: [4B] 132* 9*1, [1B] i8* %16 
Partial alias: [1B] i8* %7, [1B] i8* %16 
No alias: [2B] i16* %12, [1B] i8* %16 
Partial alias: [1B] i8* %7, [1B] i8* %16 
No alias: [4B] 132* %i, [1B] i8* %18 

No alias: [1B] i8* %18, [1B] i8* %7 

No alias: [1B] i8* %18, [1B] i8* %16 
Partial alias: [2B] i16* %12, [1B] i8* %18 
Partial alias: [2B] 116* %12, [1B] i8* %18 


===== Alias Analysis Counter Report ===== 
Analysis counted: 

12 Total Alias Queries Performed 

8 no alias responses (66%) 


0 may alias responses (0%) 

4 partial alias responses (33%) 

© must alias responses (0%) 

Alias Analysis Counter Summary: 66%/0%/33%/0% 


0 Total Mod/Ref Queries Performed 


4. 使 用 -print-alias-sets 命 令 行 选项 调用 opt 工 具 ， 输 出 程序 中 的 别名 
集合 : 


$ opt-basicaa -print-alias-sets -disable-output testcode1.bc 
Alias Set Tracker: 3 alias sets for 5 pointer values. 
AliasSet[0x336b120, 1] must alias, Mod/Ref Pointers: (i32* 
9i, 4) 
AliasSet[0x336b1cO0, 2] may alias, Ref Pointers: (i8* 
%7, 1), (i8* %16, 1) 
AliasSet[0x338b670, 2] may alias, Mod Pointers: (i16* 
%12, 2), (i8* %18, 1) 


LEER 


在 第 1 个 实例 中 ， 我 们 使 用 -aareval 选 项 ，opt 工 具 执行 了 别名 分 析 评 
估 器 Pass， 并 在 屏幕 上 输出 分 析 结 果 。 它 遍历 函数 中 的 每 对 指针 ， 以 查 
询 它 们 是 否 互 为 别名 。 


在 第 2 个 实例 中 ， 使 用 -print-dom-info 选 项 ， 执 行 输出 支配 者 树 的 
Pass， 获 得 支配 者 树 的 信息 。 


在 第 3 个 实例 中 ， 执 行 opt -count-aa -basicaa -licm ee, o aa 命令 
选项 表示 由 licmPass 对 basicaa Pass 的 查询 次 数 。 这 个 信息 通过 opt 工 具 的 
别名 分 析 计 数 (count alias analysis) Pass 来 获得 。 


最 后 一 个 实例 是 输出 程序 中 的 别名 集合 ， 使 用 -”print-alias-sets 命 令 
行 选 项 ， 它 输出 了 用 basicaa Pass 分 析 得 到 的 别名 集合 。 
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关于 更 多 这 里 未 提 及 的 Pass， 请 参见 


http://llvm.org/docs/Passes.html#analysis-passes . 








四] 原 文 为 overload， 译 者 根据 代码 ， 纠 正 为 履 写 。 一 一 译 者 注 
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编写 无 用 代码 消除 Pass 
编写 内 联 转换 Pass 
编写 内 存 优 化 Pass 
合并 LLVM IR 

循环 的 转换 与 优化 
表达 式 重 组 

RHE, 

其 他 优化 Pass 


实现 优化 


概述 


在 第 4 章 中 ， 我 们 看 到 了 如 何在 LLVM 中 编写 一 个 Pass， 也 以 别名 分 
析 为 例 ， 展 示 了 如 何 编写 一 些 分 析 Pass。 这 些 Pass 只 是 读 入 源码 ， 然 后 
给 我 们 一 些 关 于 代码 的 信息 。 在 本 章 中 ， 我 们 会 更 进一步 编写 转换 Pass 
对 源码 做 实际 修改 ， 以 尝试 对 代码 进行 优化 ， 达 到 更 高 的 执行 效率 。 前 
两 节 会 介绍 如 何 实 现 转换 Pass， 以 及 它 如 何 改 变 代码 。 在 这 之 后 ， 我 们 
会 看 到 如 何 对 Pass 的 代码 进行 改变 ， 以 增强 Pass 的 行为 。 





编写 无 用 代码 消除 Pass 


本 节 介 绍 如 何 对 程序 进行 无 用 代码 消除 优化 (dead code 
elimination〉。 无 用 代码 消除 意味 着 任何 对 源 程 序 输出 的 执行 结果 没有 
影响 的 代码 都 会 被 消除 。 执 行 这 一 优化 的 主要 原因 是 缩小 程序 大 小 ， 无 
用 代码 被 阻止 执行 ， 进 而 提高 代码 质量 ， 使 得 代码 更 容易 调试 ， 以 及 减 
少 程序 运行 时 间 。 本 节 展 示 一 个 无 用 代码 消除 的 变种 ， 被 称 为 入 侵 式 无 
用 代码 消除 ， 它 首先 假定 所 有 的 代码 都 是 无 用 的 ， 然 后 证 明 它 们 是 有 用 
的 。 我 们 会 亲自 实 现 这 个 Pass， 看 看 我 们 需要 如 何 修改 ， 让 它 能 够 像 
LLVM 代 码 库 里 lib/Transforms/Scalar 目 录 下 的 其 他 Pass 一 样 运行 。 


准备 工作 


为 了 展示 无 用 代码 消除 的 实现 ， 我 们 需要 一 段 测试 代码 ， 在 此 之 上 
运行 入 侵 式 无 用 代码 消除 Pass: 





























$ cat testcode.11 
declare i32 Qstrlen(i8*) readonly nounwind 
define void @test() { 

call i32 @strlen( i8* null ) 

ret void 


在 测试 代码 中 ，test 了 水 数 调用 了 strlen 函 数 ， 却 没有 使 用 它 的 返回 
值 。 因 此 我 们 的 Pass 认 为 对 strlen 函 数 的 调用 是 无 用 的 。 


文件 中 包含 llvm/InitializePasses.h 尖 文件 ， 在 llvm 命 名 空间 中 添加 我 
们 即将 编写 的 Pass 的 条 日 : 


namespace llvm { 


void initializeMYADCEPass(PassRegistry&); // 添 加 这 一 行 


在 include/llvm-cscalar.h/Transformy/scalar.h 文 件 下 添加 Pass 的 条 目 : 


void LLVMAddMYAggressiveDCEPass(LLVMPassManagerRef PM); 


在 include/llvm/Transform/scalar.h 文 件 中 ， 在 llvm 命 名 空间 添加 Pass 
的 条 目 : 


FunctionPass *createMYAggressiveDCEPass(); 


在 lib/Transforms/Scalarscalar.cpp 文 件 的 两 个 地 方 添加 Pass 的 条 目 ， 
并 在 void llvm::initializeScalarOpts(PassRegistry &Registry) PA Z4 FP 25 JHUN 
下 代码 : 


initializeMergedLoadStoreMotionPass(Registry); // 已 存在 于 文件 
initializeMYADCEPass(Registry); // 增 加 此 行 
initializeNaryReassociatePass(Registry); // 已 存在 于 文件 





void LLVMAddMemCpyOptPass(LLVMPassManagerRef PM) { 
unwrap(PM) ->add(createMemCpyOptPass()); 


} 

// 增加 以 下 代码 

void LLVMAddMYAggressiveDCEPass(LLVMPassManagerRef PM) { 
unwrap(PM) ->add(createMYAggressiveDCEPass()); 





} 
void LLVMAddPartiallyInlineLibCallsPass(LLVMPassManagerRef PM) { 
unwrap(PM) ->add(createPartiallyInlineLibCallsPass()); 


详细 步 又 


现在 编写 Pass 的 代码 。 
1. 引入 必要 的 头 文 件 : 


#include "llvm/Transforms/Scalar.h" 


#include "llvm/ADT/DepthFirstIterator.h" 
#include "llvm/ADT/SmallPtrSet.h" 
#include "llvm/ADT/SmallVector.h" 
#include "llvm/ADT/Statistic.h" 
#include "llvm/IR/BasicBlock.h" 
#include "llvm/IR/CFG.h" 

#include "llvm/IR/InstIterator.h" 
#include "llvm/IR/Instructions.h" 
#include "llvm/IR/IntrinsicInst.h" 
#include "llvm/Pass.h" 

using namespace llvm; 


2. 声明 Pass 的 结构 体 : 


namespace { 
struct MYADCE : public FunctionPass { 
static char ID; // Pass identification, replacement for 
typeid 
MYADCE() : FunctionPass(ID) { 
initializeMYADCEPass(*PassRegistry::getPassRegistry()); 


bool runOnFunction(Function& F) override; 

void getAnalysisUsage(AnalysisUsage& AU) const override ( 
AU.setPreservesCFG(); 

} 


}; 
} 


3. 初始 化 Pass 和 其 ID: 


char MYADCE::ID = 0; 
INITIALIZE_PASS(MYADCE, "myadce", "My Aggressive Dead Code 
Elimination", false, false) 


4. 在 runOnFunction 函 数 中 实现 实际 的 Pass;: 


bool MYADCE::runOnFunction(Function& F) { 
if (skipOptnoneFunction(F) ) 
return false; 


SmallPtrSet«Instruction*, 128» Alive; 
SmallVector«Instruction*, 128» Worklist; 


// 收集 已 知 的 根 指令 

for (Instruction &I : inst_range(F)) { 
if (isa«TerminatorInst»(I) || isa«DbgInfolIntrinsic»(I) 
|| 1Sa<LandingPadInst>(1I) || I.mayHaveSideEffects()) { 
Alive.insert(&I); 
Worklist.push back(&I); 


j 


} 
// 问 后 传播 生存 性 (liveness) 
while (!Worklist.empty()) { 

Instruction *Curr = Worklist.pop back val(); 

for (Use &OI : Curr->operands()) { 

if (Instruction *Inst = dyn cast«Instruction»-(OI)) 
if (Alive.insert(Inst).second) 
Worklist.push back(Inst); 





j 
j 


ey 在 这 个 Pass 中 ， 不 在 生存 集合 中 的 指令 被 认为 是 无 用 的 。 不 影响 控制 流 、 返 回 值 ， 
J ix 
// 有 任何 副作用 的 指令 直接 删除 
for (Instruction &I : inst_range(F)) { 
if (!Alive.count(&I)) { 
Worklist.push back(&I); 
I.dropAllReferences(); 


j 


























j 


for (Instruction *&I : Worklist) ( 
I->eraseFromParent(); 
} 


return !Worklist.empty(); 


j 
J 


FunctionPass *llvm::createMYAggressiveDCEPass() { 
return new MYADCE(); 


} 
5. 在 编译 本 节 的 “准备 工作 ”部 分 提供 的 testcode.1 文件 之 后 ， 运 行 之 
前 的 Pass: 


$ opt -myadce -S testcode.11 


; ModuleID = 'testcode.1ll' 


; Function Attrs: nounwind readonly 
declare i32 Qstrlen(i8*) #0 


define void Qtest() { 
ret void 


LEER 


在 runOnFunction 函 数 的 第 1 个 for 循 环 中 ， 这 个 Pass 首 先 会 收集 所 有 
生存 的 根 指令 列表 。 


在 while (!Worklist.empty()) 循 环 中 ， 我 们 基于 根 指令 的 活动 信息 ， 
可 以 同 后 传播 活动 信息 。 


在 接 下 来 的 for 循 环 中 ， 我 们 把 未 活动 的 指令 〈 即 无 用 的 指令 ) JH 
除 。 同 时 ， 我 们 检查 这 些 变量 是 否 被 引用 。 如 采 存 在 对 这 些 变量 的 引 
用 ， 那 么 它们 也 是 无 用 的 ， 也 全 部 删除 。 


在 对 测试 代码 运行 Pass 之 后 可 以 看 到 ， 无 用 的 strlen 函 数 调用 已 经 被 
删除 了 。 


由 于 实现 代码 已 经 加 入 了 LLVYM 代 码 库 ， 版 本 号 为 234045， 所 以 当 
ne rely ne cere HODIE 




















关于 其 他 多 种 无 用 代码 消除 方法 ， 请 参见 llvnylib/Transforms/Scalar 
目录 ， 这 里 有 其 他 类 型 的 无 用 代码 消除 的 实现 。 


编写 内 联 转换 Pass 


内 联 Gnline) 指 的 是 在 函数 调用 处 用 函数 体 直 接 进 行 蔡 换 ， 它 被 
证 明 能 够 有 效 提 高 程序 的 执行 速度 ， 而 是 否 内 联 函 数 则 由 编译 器 决定 。 
本 节 介 绍 如 何 编写 一 个 简单 的 函数 内 联 Pass 以 实现 LLVM 中 的 内 联 。 我 
们 编写 的 Pass 将 处 理 那 些 用 alwaysinline 属 性 标记 的 函数 。 


准备 工作 


首先 编写 运行 Pass 的 测试 代码 。 对 lib/Transforms/IPO/IPO.cpp、 
include/llvm/InitializePasses.h. include/llvm/Transforms/IPO.h. 
include/llvm-c/Transforms/IPO.h 做 必要 的 修改 来 包含 接 下 来 的 Pass， 并 旦 
对 makefile 做 必要 的 修改 来 包含 它 的 Pass: 














$ cat testcode.c 
define i32 @inner1i() alwaysinline { 
ret 132 1 


define i32 @outer1() { 
%r = call i32 @inner1() 


ret i32 %r 
} 


详细 步 又 


Zn 5j Pass f V fi, 
1. 引入 必要 的 头 文件 : 
#include "llvm/Transforms/IPO.h" 


#include "llvm/ADT/SmallPtrSet.h" 
#include "llvm/Analysis/AliasAnalysis.h" 


#include "llvm/Analysis/AssumptionCache.h" 
#include "llvm/Analysis/CallGraph.h" 
#include "llvm/Analysis/InlineCost.h" 
#include "llvm/IR/CallSite.h" 

#include "llvm/IR/CallingConv.h" 

#include "llvm/IR/DataLayout.h" 

#include "llvm/IR/Instructions.h" 

#include "llvm/IR/IntrinsicInst.h" 
#include "llvm/IR/Module.h" 

#include "llvm/IR/Type.h" 

#include "llvm/Transforms/IPO/InlinerPass.h" 


2. 描述 Pass 的 类 : 


namespace { 


class MyInliner : public Inliner { 
InlineCostAnalysis *ICA; 


public: 
MyInliner() : Inliner(ID, -2000000000, 
/*InsertLifetime*/ true), 
ICA(nullptr) { 
initializeMyInlinerPass(*PassRegistry::getPassRegistry()); 


MyInliner(bool InsertLifetime) 
: Inliner(ID, -2000000000, InsertLifetime), ICA(nullptr) 
initializeMyInlinerPass(*PassRegistry::getPassRegistry()); 


} 
static char ID; 
InlineCost getInlineCost(CallSite CS) override; 


void getAnalysisUsage(AnalysisUsage &AU) const override; 
bool runOnSCC(CallGraphSCC &SCC) override; 


using llvm::Pass::doFinalization; 
bool doFinalization(CallGraph &CG) override ( 

return removeDeadFunctions(CG, /*AlwaysInlineOnly-*/ 
true); 


} 
}; 
} 


3. 初始 化 Pass， 增 加 依赖 : 


char MyInliner::ID = 0; 
INITIALIZE PASS BEGIN(MyInliner, "my-inline", 

"Inliner for always inline functions", false, 
false) 
INITIALIZE AG DEPENDENCY(AliasAnalysis) 
INITIALIZE PASS DEPENDENCY(AssumptionTracker ) 
INITIALIZE PASS DEPENDENCY(CallGraphWrapperPass) 
INITIALIZE PASS DEPENDENCY (InlineCostAnalysis) 
INITIALIZE PASS END(MyInliner, "my-inline", 

"Inliner for always inline functions", false, 
false) 


Pass *llvm::createMyInlinerPass() ( return new 
MyInliner(); ) 


Pass *llvm::createMynlinerPass(bool InsertLifetime) ( 
return new MyInliner(InsertLifetime); 


} 
4. 实现 获得 内 联 开 销 的 函数 : 


InlineCost MyInliner::getInlineCost(CallSite CS) { 
Function *Callee = CS.getCalledFunction(); 
if (Callee && !Callee->isDeclaration() && 
CS.hasFnAttr(Attribute::AlwaysInline) && 
ICA->isInlineViable(*Callee) ) 
return InlineCost::getAlways(); 


return InlineCost::getNever(); 


} 
5. 编写 其 他 辅助 方法 : 


bool MyInliner::runOnSCC(CallGraphSCC &SCC) { 
ICA -0020&getAnalysis«InlineCostAnalysis»?(); 
return Inliner::runOnSCC(SCC); 


} 


void MyInliner: :getAnalysisUsage(AnalysisUsage &AU) const { 
AU.addRequired<InlineCostAnalysis>(); 
Inliner: :getAnalysisUsage(AU) ; 

} 


6. 编译 Pass， 然 后 在 之 前 的 测试 代码 上 运行 : 


$ opt -inline-threshold=0 -always-inline -S test.11 
; ModuleID = 'test.11' 


; Function Attrs: alwaysinline 
define i32 @inner1() #0 { 
ret 132 1 


} 

define i32 @outer1() { 
ret 132 1 

} 
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我 们 已 编写 的 Pass 会 作用 于 那些 标记 了 alwaysinline 属 性 的 函数 ， 这 
样 的 函数 总 是 会 被 Pass 内 联 。 


这 里 起 作用 的 主要 函数 是 mlineCost getInlineCost(CallSite CS)， 它 是 
inliner.cpp 文 件 中 的 函数 ， 需 要 在 这 里 被 履 写 。 因 此 ， 在 计算 得 到 内 联 
开销 的 基础 上 ， 我 们 决定 是 否 内 联 一 个 函数 。 而 内 联 处 理工 作 的 真正 实 
现 ， 则 位 于 inliner.cpp 文 件 。 


在 这 个 实例 中 ， 对 于 标记 了 alwaysinline 属 性 的 函数 我 们 返回 
InlineCost::get Always(); 对 于 其 他 的 ， 则 返回 InlineCost::getNever()。 用 
这 种 方式 ， 我 们 能 够 为 简单 实例 实现 内 联 。 如 果 你 想 更 进一步 了 解 其 他 
的 内 联 变 种 及 关于 内 联 决 策 的 更 多 知识 ， 你 可 以 查看 inlining.cpp 文 件 。 


当 对 测试 代码 运行 Pass 的 时 候 ， 我 们 可 以 看 到 对 inner1 函 数 的 调用 
被 它 真 实 的 函数 体 蔡 换 了 。 








编写 内 存 优化 Pass 


本 节 简 要 介绍 处 理 内 存 优化 的 转换 Pass。 


你 需要 安 钱 opt 工 具 。 


详细 步 又 


1. 首先 为 memcpy 优 化 Pass 编 写 测试 代码 : 


$ cat memcopytest.11 
@cst = internal constant [3 x i32] [132 -1, 132 -1, 132 -1], 
align 4 


declare void @llvm.memcpy.p0i8.p0i8.164(i18* nocapture, i8* 
nocapture, i64, i32, i1) nounwind 
declare void Qfoo(i32*) nounwind 


define void Qtesti1() nounwind { 

%arr = alloca [3 x 132], align 4 

%arr_ i8 = bitcast [3 x i32]* %arr to i8* 

call void @llvm.memcpy.p0i8.p0i8.164(18* %arr_i8, i8* bitcast 
([3 x 132]* @cst to i8*), i64 12, i32 4, i1 false) 

?arraydecay = getelementptr inbounds [3 x i32], [3 x i32]* 
9$arr, 164 0, i64 0 

call void Qfoo(i32* %arraydecay) nounwind 

ret void 


} 


2. 在 之 前 的 测试 实例 上 运行 memcpyoptPass: 


$ opt -memcpyopt -S memcopytest.11 


; ModuleID = ' memcopytest.11' 


@cst = internal constant [3 x 132] [132 -1, i32 -1, i32 -1], 
align 4 


; Function Attrs: nounwind 
declare void @llvm.memcpy.p0i8.p0i8.164(i18* nocapture, i8* 
nocapture readonly, i64, i32, i1) #0 


; Function Attrs: nounwind 
declare void Qfoo(i32*) #0 


; Function Attrs: nounwind 
define void @test1i() #0 { 

%arr = alloca [3 x 132], align 4 

%arr_ i8 = bitcast [3 x 132]* %arr to i8* 

call void Qllvm.memset.p018.164(i18* %arr_i8, i8 -1, 164 12, 
i32 4, i1 false) 

?arraydecay = getelementptr inbounds [3 x i32]* %arr, 164 0, 
i64 0 

call void Qfoo(i32* %arraydecay) #0 

ret void 


} 


; Function Attrs: nounwind 
declare void Qllvm.memset.p0i8.164(i18* nocapture, i8, i64, 
i32, i1) 40 


attributes #0 = [ nounwind } 
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MemcpyoptPass 会 尽 可 能 消除 memcpy 调 用 ， 或 者 把 它们 转 为 其 他 调 


考虑 如 下 memcpy 调 用 : 


call void @llvm.memcpy.p0i8.p018.164(18* %arr_i8, 18* bitcast ([3 
132]* @cst to i8*), i64 12, 132 4, i1 false) 


在 前 面 的 测试 实例 中 ， 这 个 Pass 会 将 上 面 的 调用 转 为 memset 调 用 : 


call void @llvm.memset.p0i8.164(18* %arr_i8, 18 -1, 164 12, i32 4 
false) 


如 果 我 们 去 看 这 个 Pass 的 源码 ， 会 发 现 这 个 转换 是 
llvm/lib/Transforms/ Scalar/MemCpyOptimizer.cpp X- fF fJ 
tryMergingIntoMemset Ef] Zj 1i KAY © 


tryMergingIntoMemset 函 数 在 扫 摘 内 存 转移 指令 的 时 候 会 查找 一 些 
其 他 的 模式 以 进行 折 著 。 它 会 在 邻近 的 内 存 中 寻找 仓库 ， 看 是 否 有 连续 
的 1， 如 果 有 的 话 会 把 它们 一 起 合并 到 memset 中 。 


processMem Set FK 2¢ 22 £t 1, 5; “4 Hifmemset Shit memset, ifi ET 
我 们 拓宽 memset 调 用 以 创建 一 个 更 大 的 仓库 。 
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关于 各 种 内 存 优化 Pass 类 型 的 详细 信息 ， 请 参见 


http://Ilvm.org/docs/Passes. html#memcpyopt-memcpy-optimization. 


合并 LLVM IR 


本 节 介 绍 在 LLVM 中 如 何 合并 指令 。 指 令 合并 指 的 是 把 一 系列 指令 
符 换 为 一 些 更 加 高 效 的 指令 ， 而 得 到 相同 的 结 采 ， 以 此 来 减少 CPU 周 
期 。 本 节 展 示 修 改 LLVM 代 码 来 合并 特定 的 指令 。 


准备 工作 


为 了 测试 我 们 的 实现 ， 我 们 编写 测试 代码 ， 以 确认 我 们 的 实现 是 否 
正确 地 合并 了 指令 : 





define i32 @test19(i32 %x, i32 %y, i32 %z) { 
%xOr1 = xor i32 %y, %z 
%or = or i32 %x, %xorí1 
%xOr2 = xor i32 %x, %Z 
%xOr3 = xor i32 %xor2, %y 
%res = xor 132 %or, 96xor3 
ret 132 %res 


} 
» 1- TEX 
评 细 步 又 
1. 打开 lib/Transforms/InstCombine/InstCombineAndOrXor.cpp 文 件 。 
2. ftInstCombiner::visitXor(BinaryOperator &D 函 数 中 ， 修 改 计 分 文 
并 添加 以 下 代码 : if (OpOI && Op1D) 





if (match(OpOI, m_Or(m_Xor(m_Value(B), m Value(C)), m Value(A))) 
&& 

match(OpiI, m Xor( m Xor(m Specific(A), 
m Specific(C)), m Specific(B)))) { 

return BinaryOperator::CreateAnd(A, Builder- 
>Createxor(B,C)); } 


3. 重新 构建 LLVM， 使 得 opt 工 具 能 够 使 用 这 个 新 的 功能 ， 并 用 如 下 
的 方式 运行 测试 实例 : 


Opt -instcombine -S testcode .1 
define i32 @test19(i32 %x, i32 %y, i32 %z) { 
%1 = xor i32 %y, %z 

“res = and i32 %1, %x 

ret 132 %res 
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本 节 我 们 给 指令 合并 的 文件 添加 了 一 些 代码 ， 来 处 理 包含 与 、 或 、 
异 或 运算 符 的 转换 。 


为 匹配 (AI(B^ C)) ^((A ^ C) ^ B) 形 式 的 模式 增加 代码 ， 然 后 把 它 归 
约 成 A&(BAC)。 
if(match(Op0I,m_Or(m_Xor(m_Value(B),m_Value(C)),m_Value(A)))&& 
match(Op1I,m_Xor(m_Xor(m_Specific(A),m_Specific C 
m_Specific(B)))) 语 句 查 找 与 本 段 开头 提 到 的 那个 模式 相似 的 模式 。 


return BinaryOperator::CreateAnd(A, Builder->CreateXor(B,C));i [Al 
构建 新 的 指令 后 的 归 约 值 ， 即 蔡 换 原 来 的 匹配 代码 。 


在 对 测试 代码 运行 instcombine Pass 之 后 ， 可 以 得 到 归 约 后 的 结 
你 可 以 看 到 原本 的 5 个 操作 变 成 了 2 个 。 
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。 合并 指令 这 个 话题 非常 宽泛 ， 有 大 量 的 可 能 性 。 与 指令 合并 函数 类 
似 的 是 指令 简化 函数 ， 它 把 复杂 的 指令 简化 成 简单 的 指令 ， 但 不 像 
指令 合并 那样 减少 指令 数量 。 关 于 更 多 的 细节 ， 请 参见 


lib/Transforms/InstCombine H 3X . 


循环 的 转换 与 优化 


本 节 将 介绍 对 循环 进行 转换 和 优化 以 得 到 更 短 的 执行 时 间 。 我 们 主 
要 展示 循环 常量 提升 (Loop-Invariant Code Motion——LICM) 1x 
术 ， 它 如 何 运 行 及 如 何 改变 代码 。 同 时 也 会 展示 一 种 相对 简单 的 技术 
循环 删除 ， 消 除 对 返回 值 没有 副作用 的 普通 循环 《循环 次 数 对 循环 
返回 值 无 影响 、 非 死 循 环 ) 。 


准备 工作 








1. 编写 LICM Pass 的 测试 实例 : 


$ cat testlicm.11 
define void @testfunc(i32 %i) { 
;*label»:0 
br label %Loop 
Loop: ; preds = %Loop, ?60 
%j = phi i32 [ 0, %0 ], [ %Next, %Loop ] ; «i32» 
[#uses=1] 
%12 = mul i32 %i, 17 ;<i32> [#uses=1] 
%Next = add 132 %j, %12 ;<i32> [#uses=2] 
%cond = icmp eq i32 %Next, 0 ;<i1> [#uses=1] 
br i1 %cond, label “Out, label %Loop 
Out: ;preds = %Loop 
ret void 


} 
2. 在 测试 代码 上 执行 LICM Pass: 


$ opt licmtest.11 -licm -S 
; ModuleID = 'licmtest.11' 


define void @testfunc(i32 %i) { 
%12 = mul i32 9*1, 17 
br label %Loop 


Loop: ; preds = 
%Loop, %0 
%j = phi i32 [ 0, %0 ], [ %Next, %Loop ] 
%Next = add 132 %j, %12 
%cond = icmp eq i32 %Next, 0 
br i1 %cond, label %Out, label %Loop 


Out: ; preds = 
%LOOp 

ret void 
} 


3. 编写 循环 删除 Pass 的 测试 代码 : 


$ cat deletetest.11 
define void Qfoo(i64 %n, i164 %m) nounwind { 
entry: 

br label %bb 


bb: 
%x.0 = phi i64 [ 0, *entry ], [ %t0, %bb2 ] 
%tO = add 164 %x.0, 1 
%t1 = icmp slt 164 %x.0, %n 
br i1 %t1, label %bb2, label %return 


%t2 = icmp slt 164 %x.0, %m 
br i1 %t1, label %bb, label %return 


return: 
ret void 
} 


4. 最 后 ， 在 测试 代码 上 执行 循环 删除 Pass: 


$ opt deletetest.11 -loop-deletion -S 
; ModuleID = "deletetest.11' 


; Function Attrs: nounwind 


define void Qfoo(i64 %n, i64 %m) #0 { 
entry: 
br label %return 


return: ; preds = 


“entry 
ret void 


attributes #0 = { nounwind } 
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LICM Pass 对 循环 常量 代码 进行 提升 : 它 会 把 循环 中 不 变 的 代码 提 
升 到 循环 体外 ， 或 者 是 循环 之 前 的 pre-header 块 ， 或 者 是 循环 之 后 的 exit 
块 。 


在 之 前 的 样 例 中 ，%i2 = mul i32 %i，17 这 部 分 代码 被 移 到 循环 之 
前 ， 因 为 这 条 指令 没有 在 循环 块 中 改变 。 

而 循环 删除 Pass 会 查找 对 函数 返回 值 没有 作用 ， 并 且 迭 代 有 限 次 数 
的 非 死 循环 。 


在 测试 代码 中 ， 我 们 可 以 看 到 两 个 基本 块 bb: 和 bb2: 包 含 了 无 意义 的 
循环。 因为 其 中 的 循环 被 删除 了 ， 所 以 foo 函 数 直接 跳 到 返回 语句 了 。 


对 于 循环 优化 其 实 有 很 多 其 他 的 技术 ， 例 如 ]oop-rotate、loop- 
unswitch、Loop-unroll 等 。 你 可 以 自己 尝试 ， 来 看 看 它们 如 何 改 变 代 
fu, 
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本 节 介 绍 表达 式 重组 ， 以 及 如 何在 优化 中 奏效 。 


准备 工作 


1. 首先 为 简单 的 表达 式 重 组 编写 测试 实例 : 


$ cat testreassociate.ll 

define i132 Qtest(i32 %b, i32 %a) { 
%tmp . 1 add i32 %a, 1234 
?etmp . 2 add i32 %b, %tmp.1 
9 tmp.4 = xor 132 Xa, -1 
; (b+(at1234))+~a -> b*1233 
%tmp.5 = add 132 %tmp.2, %tmp.4 
ret 132 %tmp.5 


2. 在 测试 实例 之 上 运行 重组 Pass， 碍 看 已 修改 的 代码 : 


$ opt testreassociate.ll -reassociate -die -S 
define i32 Qtest(i32 %b, i32 %a) ( 

%tmp.5 = add 132 %b, 1233 

ret 132 %tmp.5 
} 


aE 





重组 指 的 是 利用 代数 的 结合 律 、 交 换 律 、 分 配 律 来 对 表达 式 重 新 安 
排 以 实现 其 他 的 优化 ， 例 如 和 常量 折 有 登 、LICM 等 。 


在 之 前 的 样 例 中 ， 我 们 使 用 了 逆 属 性 通过 重组 来 消除 像 "X + ~ 又 "-> 
"-1 "这样 的 模式 。 


测试 实例 前 面 3 行 给 出 了 表达 式 (b+(a+1234)+~a。 在 这 个 表达 式 中 ， 
运行 重组 Pass 之 后 可 以 把 a + ~a 变 为 -1， 因 此 得 到 最 终 的 返回 值 是 b + 
1234 -1= b + 1233. 








处 理 转换 的 代码 是 在 lib/Transforms/ScalarvReassociate.cpp 文 件 中 。 


如 果 你 查看 这 个 文件 相应 的 代码 片段 ， 你 会 发 现代 码 会 查看 操作 数 
是 人 否 存在 a 和 一 a: 


if (!BinaryOperator::isNeg(TheOp) && !BinaryOperator::isNot(TheOp 
continue; 


Value *X - nullptr; 


else if (BinaryOperator::isNot(TheOp)) 
X = BinaryOperator::getNotArgument ( TheOp) ; 
unsigned FoundX - FindInOperandList(Ops, i, X); 


如 果 在 表达 式 中 有 这 样 的 值 ， 下 面 的 代码 负责 处 理 并 插入 -1: 


if (BinaryOperator::isNot(TheOp)) { 
Value *V = Constant::getAllOnesValue(X-»getType()); 
Ops.insert(Ops.end(), ValueEntry(getRank(V), V)); 
e += 1; 


IR 问 量化 


问 量 化 〈Vectorization ) 是 编译 器 的 一 个 重要 优化 ， 它 可 以 癌 量 化 
代码 ， 在 多 个 数据 集 上 同时 执行 一 条 指令 。 如 果 后 端 架 构 文 持 同 量 寄存 
器 ， 那 么 一 个 很 宽 范 围 的 数据 天 能 存储 于 这 些 同 量 寄存 器 中 ， 而 特殊 的 
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在 LLVM 中 有 两 种 类 型 的 癌 量 化 ， 一 种 是 超 字 级 并 行 (Superword 
Level Parallelism——SLP) ， 另 一 种 是 循环 同 量 化 Coop 
vectorization) 。 循 环 加 量化 针对 循环 ， 而 SLP 则 把 基本 块 中 的 线性 代 
码 癌 量化。 本 节 介 绍 线性 代码 如 何 被 癌 量 化 。 


准备 工作 


SLP 疝 量化 会 构建 一 个 自 底 向 上 的 人 R 表 达 式 树 ， 然 后 大 概 比 较 树 的 
节点 来 判断 是 否 存在 相似 节点 可 以 组 合成 向 量 。 将 要 进行 修改 的 文件 是 


lib/Transforms/Vectorize/ SLPVectorizer.cpp. 


我 们 会 尝试 对 一 段 线 性 代码 进行 回 量化 ， 例 如 reture a[0] + a[l] + 
a[2] + a[3]. 


前 面 类 型 代码 的 表达 式 树 是 非 平衡 树 ， 我 们 可 以 运行 一 次 DFS〈 深 
度 优先 搜索 ) 来 存储 操作 数 和 操作 符 。 


前 面 那 种 类 型 的 表达 式 的 IR 如 下 : 














define i32 Qhadd(i32* %a) { 
entry: 
%0 = load 132* %a, align 4 
%arrayidxi = getelementptr inbounds i32* %a, 132 1 
%1 = load 132* %arrayidx1, align 4 
%add = add nsw i32 %0, %1 
%arrayidx2 = getelementptr inbounds i32* %a, 132 2 
%2 = load 132* %arrayidx2, align 4 
%add3 = add nsw i32 %add, 962 


%arrayidx4 = getelementptr inbounds i32* %a, 132 3 
%3 = load i32* %arrayidx4, align 4 

%add5 = add nsw i32 %add3, %3 

ret 132 %add5 


问 量 化 模型 执行 以 下 3 步 。 

1. 检查 向量 化 的 合法 性 。 

2. 计算 向 量化 代码 相 比 于 标量 代码 执行 的 收益 。 

3. 如 果 前 两 个 条 件 都 满足 ， 那 么 进行 代码 的 回 量 化 。 


详细 步 又 


1. 打开 SLPVectorizer.cpp 文 件 ， 对 于 “准备 工作 ”一 节 展 示 的 I[R， 我 
们 需要 实现 一 个 新 的 函数 来 对 表达 式 树 做 DFS 授 历 : 





bool matchFlatReduction(PHINode *Phi, BinaryOperator *B, 
const DataLayout *DL) { 


if (!B) 
return false; 


if (B->getType()->isVectorTy() || 
! B-»getType( )-»isIntegerTy()) 
return false; 


ReductionOpcode = B-»getOpcode(); 

ReducedValueOpcode = 0; 

Reduxwidth = MinVecRegSize / DL->getTypeAllocSizeInBits(B- 
>getType()); 

ReductionRoot = B; 

ReductionPHI = Phi; 


if (ReduxWidth < 4) 
return false; 

if (ReductionOpcode != Instruction: :Add) 
return false; 


SmallVector<BinaryOperator *, 32> Stack; 
ReductionOps.push back(B); 
ReductionOpcode = B-»getOpcode(); 
Stack.push_back(B); 


// 遍历 树 
while (!Stack.empty()) { 
BinaryOperator *Bin = Stack.back(); 
if (Bin->getParent() !- B->getParent() ) 
return false; 
Value *OpO = Bin-»getOperand(0); 





Value *Opi = Bin-»getOperand(1); 

if (!0p0->hasOneUse() || !Opi-»hasOneUse()) 
return false; 

BinaryOperator *OpOBin 

BinaryOperator *OpiBin 

Stack.pop back(); 


// 如 果 左 右 操作 数 都 是 二 元 操作 符 则 不 处 理 

if (OpOBin && OpiBin) 
return false; 

// 左右 操作 数 都 不 是 二 元 操作 符 

if (!OpOBin && !OpiBin) { 
ReducedVals.push back(0p1); 
ReducedVals.push back(0p0); 


dyn_cast<BinaryOperator>(0p0) ; 
dyn_cast<BinaryOperator>(0p1); 























ReductionOps.push back(Bin); 
continue; 


j 
// 一 个 操作 数 是 二 元 操作 符 ， 为 进一步 的 处 理 把 它 放 到 栈 里 。 


// 把 其 他 非 二 元 操作 符 推 入 ReducedVals 
if (OpOBin) { 
if (OpOBin->getOpcode() !- ReductionOpcode) 
return false; 
Stack.push back(OpOBin); 
ReducedVals.push back(0p1); 




















ReductionOps.push back(OpOBin); 
} 


if (OpiBin) { 
if (Op1Bin->getOpcode() != ReductionOpcode) 
return false; 
Stack.push_back(Op1Bin) ; 


ReducedVals.push back(0p0); 
ReductionOps.push back(OpiBin); 


j 


SmallVector«Value *, 16» Temp; 
// i&a[3], a[2], a[1], a[e]/x4&Xa[0], a[1], a[2], a[3] 
while (!ReducedVals.empty()) 
Temp.push back(ReducedVals.pop back val()); 
ReducedVals.clear(); 
for (unsigned i = 0, e = Temp.size(); i < e; ++i) 
ReducedVals.push back(Temp[i]); 
return true; 


j 


2. TE Se IRDA, JUI EET XAR. TE 
SLPVectorizer.cpp X.fF HH, AgetReductionCostré Zi 19 Jn LA FARES: 


int HAddCost - INT MAX; 
// 如 果 识 别 到 水 平添 加 模式 ， 就 计算 向 量化 开销 


// 水 平添 加 模式 条 件 可 以 被 建 模 为 对 子 丫 量 的 洗 牌 shuffle) 、 增 加 回 量 、 提 取 回 量 


TORR 
































// 例如 ，a[9]+a[1]+a[2]+a[3] 可 以 建 模 为 

// %1 = load <4 x» %0 

// %2 = shuffle %1 «2, 3, undef, undef> 
// %3 = add «4 x» %1, %2 


// %4 = shuffle %3 <1, undef, undef, undef> 
// %5 = add «4 x» %3, %4 


// %6 = extractelement %5 «0» 
if (IsHAdd) { 

unsigned VecElem = VecTy-»getVectorNumElements(); 

unsigned NumRedxLevel = Log2 32(VecElem); 

HAddCost = NumRedxLevel * 
(TTI->getArithmeticInstrCost(ReductionOpcode, VecTy) + 
TTI-»getShuffleCost(TargetTransformInfo:: 

SK ExtractSubvector, VecTy, VecElem / 2, VecTy)) + 
TTI-»getVectorInstrCost(Instruction::ExtractElement, 
VecTy, 0); 


3. 在 同一 个 函数 中 ， 计 算 PairwiseRdxCost 和 SplittingRdxCost 之 后 ， 


与 HAddCost 比 较 : 


VecReduxCost = HAddCost< VecReduxCost ? HAddCost 
VecReduxCost; 





4. 在 vectorizeChainsInBlock0) 函 数 中 调用 之 前 定义 的 matchFlat 
Reduction() K 20: 


// 尝试 有 回报 的 向 量化 水 平 归 约 
if (ReturnInst *RI = dyn cast«ReturniInst»(it)) 








if (RI->getNumOperands() != 0) 
if (BinaryOperator *BinOp = 
dyn_cast<BinaryOperator>(RI->getOperand(0))) { 


DEBUG(dbgs()«« "SLP: Found a return to vectorize.\n"); 


HorizontalReduction HorRdx; 
IsReturn = true; 


if ((HorRdx.matchFlatReduction(nullptr, BinOp, DL) && 
HorRdx.tryToReduce(R, TTI)) || tryToVectorizePair(BinOp- 
>getOperand(0), BinOp->getOperand(1), R)) { 

Changed = true; 


it = BB->begin(); 
e = BB->end(); 





continue; 
} 
} 
5. 定义 两 个 全 局 标记 来 记录 有 回报 的 水 平 归 约 Chorizontal 
reduction ) : 


static bool IsReturn = false; 
static bool IsHAdd = false;Vector 


6. MRA LK, ASA SY IAS HD Za, 73 
isFullyVectorizableTiny Tree() 函 数 增加 代码 : 


if (VectorizableTree.size() == 1 && IsReturn && IsHAdd) 
return true; 


CHER 


在 保存 了 包含 以 上 代码 的 文件 之 后 ， 重 新 编译 LLVM 项 目 ， 在 样 例 
IR 上 运行 opt 工 具 ， 如 下 所 述 。 


1. 打开 example.1 文 件 ， 把 如 下 的 了 粘贴 进去 : 


define i32 @hadd(i32* %a) { 
entry: 
%0 = load i32* %a, align 4 
?arrayidxi = getelementptr inbounds i32* %a, i32 1 
%1 = load i32* %arrayidx1, align 4 
%add = add nsw 132 %0, %1 
?arrayidx2 = getelementptr inbounds i32* %a, i32 2 
%2 = load i32* %arrayidx2, align 4 
%add3 = add nsw i32 %add, 9*2 
?arrayidx4 = getelementptr inbounds i32* %a, i32 3 
%3 = load 132* %arrayidx4, align 4 
%add5 = add nsw i32 %add3, %3 
ret 132 %add5 


2. 在 example.] 文件 上 运行 opt 工 具 : 


$ opt -basicaa -slp-vectorizer -mtriple-aarch64-unknown-linux-gnu 
-mcpu=cortex-a57 


输出 如 下 的 向 量化 的 代码 : 


define i32 @hadd(i32* %a) { 


entry: 

%0 = bitcast i32* %a to<4 x i32>* 

%1 = load<4 x i32>* %0, align 4 %rdx.shuf = shufflevector<4 
X 132> %1,<4 x i32» undef,<4 x 132><i32 2, 132 3, i32 
undef, i32 undef> 


%bin.rdx = add<4 x i32» %1, 

%rdx.shuf %rdx.shuf1 = shufflevector<4 x i32> 
%bin.rdx,<4 x 132> undef,«4 x 132><i32 1, i32 undef, i32 
undef, i32 undef> %bin.rdx2 = add<4 x i32» %bin.rdx, 
?erdx . shuf1 

%2 = extractelement<4 x 132» %bin.rdx2, i32 0 


ret i32 %2 


} 


a UJEZI, RERE f. matchFlatReduction() A ZEE E 
HÍT f DFS, EMA EN i Beas Ais TReducedVals, MA Waddie te 
都 存储 于 ReductionOps。 在 此 之 后 ， 在 HAddCost 计 算 水 平 向 量化 的 开 
销 ， 并 与 标量 计算 比较 ， 以 判断 是 个 获 益 。 如 果 获 益 ， 就 执行 向 量化 表 
达 式 ， 即 执行 已 经 实现 的 tryToReduce() 函 数 。 
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e 关于 癌 量 化 的 更 多 详细 概念 ， 请 参考 论文 Loop-Aware  SLP in 
GCC， 由 Ira Rosen, Dorit Nuzman 和 Ayal Zaks 所 车 。 


其 他 优化 Pass 


本 节 介 绍 更 多 的 一 些 变换 Pass， 它 们 更 像 是 共用 的 Pass。 我 们 会 分 
析 strip-debug- symbols 和 prune-eh Pass. 


准备 工作 


你 需要 安 厂 opt 工 具 。 


1. 首先 ， 编 写 strip-debug Pass 的 测试 实例 ， 它 会 把 调试 符号 从 测试 
代码 中 删除 : 


$ cat teststripdebug.11 
@x = common global i32 0 
[#uses=0 ] 


; <132*> 


define void @foo() nounwind readnone optsize ssp { 
entry: 

tail call void @llvm.dbg.value(metadata i32 0, i64 0, 
metadata !5, metadata !{}), !dbg !10 

ret void, !dbg !11 
} 


declare void @llvm.dbg.value(metadata, i64, metadata, 
metadata) nounwind readnone 


!1lvm.dbg.cu = !{!2} 
!1lvm.module.flags = !{!13} 
!llvm.dbg.sp = !{!0} 
!1lvm.dbg.lv.foo = !{!5} 
!1lvm.dbg.gv = !{!8} 


10 = !MDSubprogram(name: "foo", linkageName: "foo", line: 2, 


isLocal: false, isDefinition: true, virtualIndex: 6, 
isOptimized: true, file: !12, scope: !1, type: !3, function: 
void ()* @foo) 

11 = !MDFile(filename: "b.c", directory: "/tmp") 

12 - !MDCompileUnit(language: DW LANG C89, producer: "4.2.1 
(Based on Apple Inc. build 5658) (LLVM build)", isOptimized: 
true, emissionKind: 0, file: !12, enums: !4, retainedTypes: 
14) 

13 = !MDSubroutineType(types: !4) 

14 = !{null} 

!5 = !MDLocalVariable(tag: DW_TAG_auto_variable, name: "y", 
line: 3, scope: !6, file: !1, type: !7) 

!6 = distinct !MDLexicalBlock(line: 2, column: 0, file: !12, 
scope: !0) 

17 = !MDBasicType(tag: DW TAG base type, name: "int", size: 
32, align: 32, encoding: DW ATE signed) 

18 = !MDGlobalVariable(name: "x", line: 1, isLocal: false, 
isDefinition: true, scope: !1, file: !1, type: !7, variable: 
i132* @x) 

19 = !(i32 0) 








110 = !MDLocation(line: 3, scope: !6) 
111 = !MDLocation(line: 4, scope: !6) 
112 = !MDFile(filename: "b.c", directory: "/tmp") 
113 = !{132 1, !"Debug Info Version", i32 3} 
2. 将 -strip-debug 命 令 行 选项 传 入 opt 工 具 ， 运 行 strip-debug- 
symbolsPass: 


$ opt -strip-debug teststripdebug.11-S 
; ModuleID = ' teststripdebug.11' 


@x = common global i32 0 
; Function Attrs: nounwind optsize readnone ssp 
define void @foo() #0 ( 
entry: 
ret void 


} 


attributes #0 = { nounwind optsize readnone ssp } 
!1lvm.module.flags = !{!0} 


!0 = metadata !{i32 1, metadata !"Debug Info Version", i32 2} 


3. 编写 检查 prune-ehPass 的 测试 实例 : 


$ cat simpletest.11 
declare void @nounwind() nounwind 


define internal void @foo() { 
call void @nounwind( ) 
ret void 


} 


define i32 @caller() { 
invoke void @foo( ) 
to label %Normal unwind label %Except 


Normal: ; preds = %0 
ret 132 0 


Except: ; preds = %0 
landingpad ( i8*, 132 ) personality i32 (...)* 
Q gxx personality vO 
catch i8* null 
ret 132 1 


declare i32 Q gxx personality vO(...) 


4. 通过 将 -prune-eh 命 令 行 选项 传 入 opt 工 具 运行 Pass， 删 除 未 使 用 的 
em A n 
FF rm 处 理 信 iy? 


$ opt -prune-eh -S simpletest.11 
; ModuleID = 'simpletest.11' 


; Function Attrs: nounwind 
declare void @nounwind() #0 


; Function Attrs: nounwind 
define internal void Qfoo() £0 ( 
call void Qnounwind() 
ret void 


} 


; Function Attrs: nounwind 
define i32 @caller() #0 { 
call void @foo() 
br label %Normal 


Normal: ; preds = %0 
ret i32 0 


declare i32 Q gxx_ personality vO(...) 


attributes #0 = { nounwind } 


CE RS 


在 第 一 个 实例 中 ， 我 们 运行 了 strip-debug Pass， 它 会 把 代码 中 的 调 
试 信 息 删 除 ， 得 到 更 加 紧凑 的 代码 。 这 个 Pass 仅 仅 用 于 得 到 更 加 紧凑 的 
代码 ， 因 为 它 能 删除 虚拟 寄存 器 的 名 字 ， 以 及 内 部 全 局 变量 和 函数 的 符 
写 ， 使 得 源码 可 读 性 降低 并 且 增 加 了 逆 同 工程 代码 的 难度 。 


处 理 这 个 转换 的 代码 部 分 位 于 
llvnylib/Transforms/IPO/StripSymbols.cpp 文 件 ， 其 中 
StripDeadDebugInfo::runOnModule 函 数 负责 删除 调试 信息 。 


第 二 个 测试 是 使 用 prune-eh Pass， 删 除 未 使 用 的 异常 处 理 信息 ， 它 
实现 一 个 过 程 间 Pass 〈interprocedural) 。 它 遍历 函数 调用 图 ， 如 果 被 调 
函数 不 抛 出 异常 ， 就 把 invoke 指 令 转 为 call 指 令 ， 如 有 果 函 数 本 吴 不 抛 出 异 
常 ， 就 把 函数 标记 上 nounwind。 
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。 关于 其 他 转换 Pass 的 信息 ， 请 参见 


http://llvm.org/docs/Passes.html#transform-passes o 


6m PAKS eat 
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LLVM IR 指 令 的 生命 周期 
使 用 GraphViz 可 视 化 LLVM IR 控 制 流 图 
使 用 TableGen 描 述 目 标 平台 
定义 指令 集 

添加 机 器 人 码 描述 

实现 MachineInstrBuilder 关 
实现 MachineBasicBlock 类 
实现 MachineFunction 类 

编写 指令 选择 器 

合法 化 SelectionDAG 

优化 SelectionDAG 

基于 DAG 的 指令 选择 

基于 SelectionDAG 的 指令 调度 


概述 


在 优化 LLVM IR 之 后 ， 它 需要 被 转 为 机 器 指令 才能 执行 ， 而 平台 无 
关 的 代码 生成 右 接 口 则 为 从 IR 到 机 器 指令 的 转换 提供 了 一 个 抽象 层 。 在 
这 个 阶段 ，IR 被 转换 为 SelectionDAG (DAG 指 的 是 有 向 无 环 图 ) , 之 
后 多 个 阶段 会 作用 于 SelectionDAG 的 节点 。 本 章 描 述 了 平台 无 关 的 代码 
生成 过 程 中 的 几 个 重要 阶段 。 





LLVM IR 指 令 的 生命 周期 


前 面 的 章节 中 我 们 看 到 了 高 级 语言 指令 、 声 明 、 风 辑 块 、 函 数 调 
用 、 循 环 等 如 何 被 转 为 LLVM IR， 然 后 在 IR 上 会 实施 各 种 优化 Pass 使 它 
达到 最 佳 的 状态 。 生 成 的 LLVM IR 是 SSA 形 式 的 ， 它 是 抽象 的 并 且 与 高 
级 或 低级 语言 的 约束 无 关 ， 因 此 才能 运行 各 种 优化 Pass。 除 了 这 些 平台 
c em 还 有 一 些 优化 是 平台 相关 的 ， 会 在 IR 转 为 机 器 指令 之 
rH Hist. 


在 得 到 优化 过 的 LLVM IR 之 后 ， 下 一 个 阶段 就 是 把 它 转 为 目标 平台 
的 指令 了 。LLVM 通 过 SelectionDAG 来 将 朴 转 为 机 器 指令 。 在 此 过 程 
中 ， 指 令 通 过 DAG 的 节 扣 来 表示 ， 最 后 线性 的 IR 便 被 转 为 了 
SelectionDAG。 在 此 之 后 ，SelectionDAG 还 要 经 历 以 下 几 个 阶段 。 








由 LLVM IR 创 建 SelectionDAG。 

SelectionDAG 节 点 合法 化 。 

DAG 合 并 优化 。 

针对 目标 指令 的 指令 选择 。 

调度 并 发 射 机 器 指令 。 

SERA NU -SSA 解 构 、 寄 存 器 赋值 、 寄 存 器 溢出 。 
KON BLAS 1 o 


所 有 以 上 步骤 在 LLVM 中 都 是 模块 化 的 。 





C 代 码 到 LLVM IR 


第 一 步 是 把 前 端 语 言 的 样 例 转 为 LLVM IR。 样 例如 下 : 


int test (int a, int b, int c) { 
return c/(atb); 
J 


以 上 的 C 语 言 代 码 得 到 的 LLVM IR: 


define i32 Qtest(i32 %a, 132 %b, 132 %c) ( 
%add = add nsw i32 %a, 96b 
%div = sdiv 132 %add, %c 
return 132 %div 


IR 优 化 


如 同 之 前 章节 所 描述 的 ， 之 后 IR 便 要 经 历 多 种 优化 Pass。IR 在 转换 
阶段 ， 要 经 历 InstCombine Pass 的 InstCombiner::visitSDiv() 函 数 。 此 函数 
会 调用 SimplifyS DivImstO 函 数 ， 它 会 检查 是 否 还 存在 进一步 简化 指令 的 
机 会 。 


LLVM IR 转 为 SelectionDAG 


在 IR 转 换 和 优化 之 后 ，LLVM IR 指 令 会 转换 为 SelectionDAG 节 点 。 
Selection DAG 节 点 由 SelectionDAGBuilder 类 创建 ，SelectionDAGISel 类 
Val FjSelectionDAGBuilder::visit() ri Zt, 358 7] REA IRE OR OIE 
SDAGNode 节 点 。SelectionDAGBuilder::visitSDiv 方 法 用 于 处 理 SDiv 指 
令 ， 它 会 依据 ISD::SDIV 操 作 码 来 向 DAG 请 求 一 个 新 的 SDNode 节 点 ， 再 
创建 DAG 中 的 节点 。 


合法 化 SelectionDAG 


目前 创建 的 SelectionDAG 节 点 未 必 会 被 目标 架构 全 部 文 持 ， 因 此 还 
需要 对 DAG 节 点 做 出 一 点 修改 以 适应 目标 平台 ， 这 一 过 程 叫 作 合 法 化 
(legalization) 。 在 Selection DAG 的 初始 阶段 ， 这 些 不 被 文 持 的 节点 被 
认为 是 不 合法 的 。 在 SelectionDAG 机 制 真 正 为 DAG 节 点 进行 机 器 指令 发 
射 之 前 ， 这 些 不 合法 的 节点 都 会 做 一 些 转换 以 文 持 目 标 平 台 。 因 此 ， 合 
法 化 是 代码 发 射 之 前 最 重要 的 阶段 之 一 。 





SDNode 合 法 化 包括 数据 类 型 和 操作 两 个 方面 。 目 标 平台 的 相关 信 
居 通 过 一 个 叫 作 TargetLowering 的 接口 传递 给 平台 无 关 的 算法 ， 这 个 接 
口 由 目标 平台 实现 ， 摘 述 了 LLVM IR 如 何 lowering 到 合法 的 
SelectionDAG 操 作 。 例 如 ，x86 平 台 的 lowering 由 X86TargetLowering 接 口 
实现 。 在 lowering 的 过 程 中 ， 由 setOperationAction(0) 函 数 来 指定 ISD 节 点 
是 否 需 要 被 操作 合法 化 扩展 或 改变 。 在 此 之 后 ，SelectionDAGL 
egalize::LegalizeOp 如 果 发 现 扩展 标记 ， 就 在 setOperationAction0 调 用 中 
用 特定 参数 普 换 SDNode 节 点 。 


从 目标 平台 无 关 DAG 转 换 为 机 器 DAG 


在 完成 指令 合法 化 之 后 ，SDNode 需 要 被 转 为 MachineSDNode， 也 
就 是 转 为 日 标 平 台 的 机 器 指令 。 机 器 指令 由 一 个 通用 的 基于 表 的 .td 文件 
描述 ， 之 后 这 些 文件 通过 tablegen 工 具 转 为 .inc 文 件 ， 在 .inc 文 件 中 用 枚 
举 类 型 描述 了 目标 平台 的 寄存 器 、 指 令 集 等 信息 ， 并 且 可 以 直接 被 
C++ 代码 调用 。 指 令 选 择 的 过 程 可 以 由 SelectCode 上 自动 选 择 喜 完成 ， 或 
者 通过 编写 自 定 义 的 SelectionDAGISel::Select 函 数 自己 定制 。 在 这 一 步 
中 创建 的 DAG 节 点 是 MachineSDNode 节 点 ， 它 是 SDNode 的 子 类 ， 持 有 
用 来 构建 真实 机 器 指令 的 必要 信息 ， 但 仍 是 DAG 节 点 形式 。 


指令 调度 


机 器 执行 线性 指令 集 ， 而 现在 我 们 得 到 的 机 器 指令 仍 是 DAG 形 式 
的 ， 所 以 还 需要 把 DAG 转 为 线性 指令 集 ， 这 个 过 程 可 以 通过 对 DAG 进 
行 一 次 拓扑 排序 完成 。 尽 管 很 轻松 地 就 能 得 到 线性 指令 集 ， 但 它 可 能 不 
是 最 优化 的 结果 ， 例 如 由 于 指令 依赖 、 寄 存 占 压力 、 流 水 线 阻 窗 等 问 
题 ， 都 会 造成 执行 延迟 。 因 此 还 需要 对 线性 指令 集 进 行 顺序 上 的 优化 ， 
这 个 过 程 叫 作 指令 调度 。 由 于 目标 平台 有 目 己 的 寄存 器 集 和 目 定义 的 指 
令 流 水 线 ， 所 以 它们 也 提供 了 自己 的 调度 接口 和 一 些 启发 式 算法 来 优 
化 、 加 速 代 码 。 在 计算 了 代码 的 最 佳 执行 顺序 之 后 ， 调 度 器 就 会 及 射 机 
需 基 本 块 中 的 机 器 指令 ， 最 终 解构 DAG。 
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在 发 射 机 器 指令 之 后 ， 分 配 的 寄存 器 是 虚拟 寄存 器 (virtual 
register) 。 实 际 中 ， 可 以 分 配 无 限 数量 的 虚拟 寄存 器 ， 而 真实 机 器 的 寄 
存 器 数量 却 是 有 限 的 。 这 些 有 限 的 寄存 器 需要 被 有 效 分 配 。 如 有 果 无 法 做 
到 ， 就 会 造成 寄存 器 溢出 0 (register spilling) ， 导 仅见 余 的 加 载 或 存储 
eee 不 仅 减 慢 了 执行 速度 ， 而 且 增 加 

于 5 


寄存 器 分 配 有 多 种 算法 。 在 分 配 寄存 器 时 有 一 个 重要 的 分 析 一 38 
量 活跃 度 和 活动 周期 的 分 析 。 如 果 两 个 变量 在 一 个 周期 内 活动 ， 即 它们 
之 前 存在 周期 冲突 ， 那 么 它们 束 不 能 分 配 到 同一 个 寄存 占 。 通 过 分 析 活 
跃 度 ， 可 以 画 出 冲突 图 (interference graph) ， 再 使 用 图 染色 算法 进行 
Nd 
时 间 。 


LLVM 采 用 了 贪心 法 来 进行 寄存 器 分 配 ， 即 活动 周期 越 长 的 变量 先 
分 本 寄存器。 生存 周期 短 的 变量 则 填补 可 用 寄存 器 的 时 间 间 隙 ， 减 少 江 
出 权重 。 滋 出 是 由 于 没有 足够 的 寄存 器 分 配 而 发 生 的 加 载 存储 操作 ， 滋 
出 权重 是 溢出 的 操作 开销 。 有 时 ， 活 动 周 期 也 会 溢出 ， 让 变量 能 够 容纳 
于 寄存 器 当中 。 


再 要 注意 的 是 ， 在 寄存 器 分 配 之 前 指令 都 是 SSA 形 式 的 ， 而 在 现实 
世界 中 SSA 形 式 并 不 真 的 存在 ， 因 为 不 会 存在 具有 无 限 寄 存 吉 的 机 右 。 
在 一 些 架构 类 型 中 ， 一 些 指令 需要 固定 寄存 器 。 
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目前 为 止 ， 原 始 的 高 级 语言 已 经 翻译 为 机 器 指令 了 ， 下 一 步 就 是 代 
码 发 射 。LLVM 中 代码 发 射 有 两 种 方式 ， 一 种 是 JIT， 直 接 把 代码 发 射 到 
内 存 ， 然 后 执行 ， 另 一 种 则 是 使 用 MC 框 架 ， 对 所 有 的 后 端 目标 平台 来 
说 ， 都 可 以 发 射 到 汇编 和 目标 文件 。LLVMTarget 
Machine::addPassesToEmitFile 函 数 负责 定义 发 射 代 码 到 目标 文件 的 行为 























序列 ， 而 具体 的 MI 到 MCInst 的 转换 是 在 AsmPrinter 接 口 的 EmitInstruction 
函数 中 实现 的 。 如 果 想 发 射 目 标 文件 《或 汇编 代码 ) ， 可 以 通过 实现 
MCStreamer 接 口 来 完成 。 例 如 ， 静 态 编译 工具 llc 束 可 以 用 来 为 目标 平台 
生成 汇编 指令 。 





使 用 GraphViz 可 视 化 LLVM IR 探 制 流 
E 


LLVM IR 的 控制 流 图 可 以 通过 GraphViz 工 具 来 可 视 化 。 它 提供 了 已 
形成 节点 的 可 视 化 描述 和 已 生成 了 中 代码 流 的 走向 。 在 LLVM 中 ， 很 多 
重要 的 数据 结构 都 是 用 图 来 表示 的 ， 因 此 当 编 写 自 定义 Pass 或 学 习 IR 模 
式 的 行为 时 理解 IR 流 是 非常 有 用 的 方式 。 


准备 工作 


1. 如 果 在 Ubuntu 安装 graphviz， 需 要 先 添 加 ppa 仓 库 : 





$ sudo apt-add-repository ppa:dperry/ppa-graphviz-test 


2. 更 新 程序 包 仓 库 : 


$ sudo apt-get update 


3. 安装 graphviz: 


$ sudo apt-get install graphviz 


如 果 你 得 到 以 下 报错 : graphviz: Depends:libgraphviz4 (>= 
2.18) , but it is going to be installed， 请 执行 以 下 命令 : 


$ sudo apt-get remove libcdt4 
$ sudo apt-get remove libpathplan4 


然后 使 用 以 下 命令 安装 graphviz: 


$ sudo apt-get install graphviz 


详细 步 又 


1. 一 旦 IR 转 为 DAG 之 后 ， 在 之 后 的 各 个 阶段 可 以 分 别 查 看 。 创 建 包 
含 以 下 代码 的 test.] 文件 : 


$ cat test.11 

define i32 @test(i32 %a, 132 %b, i32 %c) { 
%add = add nsw 132 %a, %b 
%div = sdiv 132 %add, %c 
ret 132 %div 

} 





2. 执行 以 下 命令 ， 展 示 在 构建 之 后 ， 执 行 第 1 次 优化 Pass 之 前 的 
DAG: 


$ llc -view-dag-combinei-dags test.1ll 


下 图 展示 了 在 执行 第 1 个 优化 Pass 之 前 的 DAG: 


3. 执行 以 下 命令 ， 展 示 合 法 化 之 前 的 DAG: 


$ llc -view-legalize-dags test.1l 


下 图 这 是 合法 化 阶段 之 前 的 DAG: 


4. 执行 以 下 命令 ， 展 示 在 执行 第 2 个 优化 Pass 之 前 的 DAG: 


$ llc -view-dag-combine2-dags test.1l 


下 图 展示 在 执行 第 2 个 优化 Pass 之 前 的 DAG: 


5. 输入 以 下 命令 ， 展 示 在 执行 指令 选择 阶段 之 前 的 DAG: 


$ llc -view-isel-dags test.ll 


下 图 展示 在 执行 指令 选择 阶段 之 前 的 DAG: 


6. 执行 以 下 命令 ， 展 示 在 执行 指令 调度 之 前 的 DAG: 
$ llc -view-sched-dags test.11 


下 图 是 在 执行 指令 调度 之 前 的 DAG: 


7. HÁTA Rae, EJS VaR ae ES MORES: 
$ llc -view-sunit-dags test.1l 


下 图 展示 指令 调度 器 的 依赖 图 : 


注意 在 合法 化 阶段 前 后 DAG 中 的 区 别 。 由 于 x86 目 标 平 台 不 支持 
sdiv 节 点 ， 仪 支持 sdivrem 指 令 ， 所 以 DAG 中 的 sdiv 节 点 被 转换 为 sdivrem 
节点 。 在 这 种 情况 下 ， 对 x86 目 标 平 台 来 说 sdiv 指 令 是 不 合法 的 。 在 合法 
化 阶段 将 其 转换 为 sdivrem 指 令 ， 被 x86 目 标 平台 文 持 了 。 


同样 ， 注 意 在 指令 选择 (ISel) 阶段 前 后 的 DAG 也 有 区 别 。 像 Load 
这 样 的 平台 无 关 的 抽象 指令 被 转 为 MOV32rm 机 器 代码 (从 内 存 移动 32 
位 数据 到 寄存 器 ) 。 因 此 指令 选择 阶段 也 是 相当 重要 的 一 个 阶段 ， 之 后 
的 章节 会 描述 。 


观察 DAG 的 调度 单元 。 每 个 单元 被 连接 在 一 起 ， 它 们 之 间 存 在 依 
赖 。 对 于 调度 算法 来 说 ， 这 些 依赖 信息 则 非常 重要 。 例 如 ， 在 前 面 的 例 
子 中 ， 调 度 单元 0 (SU0) 依赖 调度 单元 1 (SUD ， 所 以 SU0 中 的 指令 
不 能 在 SU1 的 指令 之 前 被 调度 。 同 样 ，SU1 依 赖 SU2，SU2 依 赖 SU3。 
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。 关于 在 debug 模 式 下 但 看 这 些 图 的 更 多 信息 ， 请 参见 
http:/Alvm.org/docs/ProgrammersManual.html#viewing-graphs-while- 
debugging-code. 


使 用 TableGen 搞 述 目标 平台 


目标 架构 可 以 用 寄存 器 集合 、 指 令 集 等 形式 来 描述 。 手 动 来 编写 这 
些 信息 是 单调 乏味 的 ， 为 了 降低 后 端 开发 者 描述 目标 平台 的 难度 ， 
LLVM 采 用 TableGen 工 具 以 及 描述 式 的 语言 一 一 *.td 文 件 来 描述 目标 平 
台 。 而 *.td 文 件 可 以 转 为 enqum 类 型 、DAG 模 式 匹 配 函 数 、 指 令 编 码 解码 
函数 ， 因 此 编码 时 可 以 在 C++ 文件 中 调用 。 


为 了 在 目标 描述 的 .td 文中 定义 寄存 器 和 寄存 器 集合 ，tablegen 将 .td 


文件 转 为 inc 文件 ， 可 以 在 .cpp 文 件 中 用 区 nclude 语 法 来 引入 ， 从 而 引用 
其 中 的 寄存 器 。 


准备 工作 


假定 我 们 的 目标 平台 有 4 个 通用 寄存 器 ，r0 一 I3， 一 个 栈 指针 寄存 器 
sp， 一 个 链接 寄存 器 lr。 这 些 信息 可 以 在 SAMPLERegisterInfo.td 文 件 中 
间 定 ， 并 且 TableGen 工 具 提 供 了 Register 类 ， 通 过 继承 可 以 指定 其 他 的 


详细 步 又 


1. 在 lib/Target 创 建 SAMPLE 目 录 : 











$ mkdir llvm root directory/lib/Target/SAMPLE 


2. ÁESAMPLE H3& F fi!| f£ SAMPLERegisterInfo.td X. f : 


$ cd llvm root directory/lib/Target/SAMPLE 
$ vi SAMPLERegisterInfo.td 





3. EAP AS. a RIB]. ae Fea, UARAN: 


Class SAMPLEReg<bits<16> Enc, string n> : Register<n> { 
let HWEncoding = Enc; 
let Namespace = "SAMPLE"; 


j 


foreach i = 0-3 in { 
def RZi : R<i, "r"#i >; 


} 
def SP : SAMPLEReg<13, "sp">; 
def LR : SAMPLEReg<14, "Ir">; 


def GRRegs : RegisterClass<"SAMPLE", [132], 32, 
(add RO, R1, R2, R3, SP)»; 


LEER 


TableGen 工 具 会 把 这 个 .td 文件 处 理 成 .pc 文件 ， 其 中 寄存 器 用 enum 
形式 表示 ， 进 而 可 以 在 .cpp 文 件 代 码 中 调用 。 这 些 .inc 文 件 会 在 构建 
LLVM 项 目的 时 候 创 建 。 
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。 关于 高 级 架构 〈 例 如 x86) 中 定义 寄存 器 的 更 多 细节 ， 请 参见 
llvm_source_ code/lib/Target/X86/X86RegisterInfo.td X. f/f .- 


Ps VEE AB 
定义 指令 集 

根据 架构 特性 的 不 同 ， 架 构 的 指令 集 也 会 不 同 。 本 节 介 绍 如 何 定义 
目标 架构 的 指令 集 。 


准备 工作 


H4 A tpt SESE BT AA: 操作 数 、 汇 编 字 符 串 、 指 令 格 
式 。 指 令 集 的 说 明文 件 中 包含 一 系列 的 定义 、 输 出 、 使 用 、 输 入 。 这 其 
中 会 有 不 同 的 操作 数 类 ， 人 例如， 寄存 器 类 、 工 即 数 Cimmediate) 类， 
或 者 更 复杂 的 register+imm 操 作 数 。 


这 里 展示 了 一 个 简单 的 add 指 令 定义 ， 它 以 3 个 寄存 需 作 为 操作 数 ， 
2 个 输入 ，1 个 输出 。 


Vv. Te X 
评 细 步 又 
1. 在 lib/Target/SAMPLE 目 录 创 建新 的 SAMPLEInstrInfo.td 文 件 : 


$ vi SAMPLEInstrInfo.td 


2. 指定 两 个 寄存 器 操作 数 之 间 add 指 令 的 操作 数 、 汇 编 字符 串 ， 以 
及 指令 格式 : 


def ADDrr : InstSAMPLE<(outs GRRegs:$dst), 
(ins GRRegs:$srci, GRRegs:$src2), 
"add $dst, $src1, $src2", 
[(set i32:$dst, (add i32:$src1, i32:$src2))]»; 


“CE RS 


add 寄 存 器 指令 指定 $dst 作 为 结果 操作 数 ， 其 属于 通用 寄存 器 类 型 
2E: $src1 和 $src2 输 入 是 两 个 输入 操作 数 ， 它 们 都 属于 通用 寄存 器 类 ; 
令 的 汇编 字符 串 格式 为 add $dst, $src1, $src2， 是 32 位 整 型 类 型 。 


因此 ， 对 两 个 寄存 器 执行 add 指 令 产生 的 汇编 码 如 下 : 





add rO, rO, r1 


这 条 汇编 码 表示 将 r0 和 rl 寄存 器 中 的 值 相 加 ， 结 果 存 储 于 r0 寄 存 
fi o 
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e 关于 高 级 架构 〈 例 如 x86) 的 各 种 类 型 指令 集 的 详细 信息 ， 请 参见 
lib/Target/X86/X86InstrInfo.td X. f/f. 

。 关于 具体 如 何 定义 平台 相关 的 信息 ， 在 第 8 章 “ 实 现 LLVM 后 端 ”会 
有 人 介绍。 一些 概念 会 有 重复 ， 但 是 前 面 的 章节 只 是 简略 颖 视 了 一 下 
目标 架构 的 描述 方法 ， 算 是 接 下 来 章节 的 一 个 预告 。 























Vs DUAL As AS FH aS 


LLVM IR& Pt, PALM ZEAL (basic block) 组 成 ， 而 基本 
块 由 指令 组 成 。 下 一 个 逻辑 步 又 束 是 把 IR 抽 象 块 的 内 容 转 为 指定 机 器 的 
区 块 ， 换 言 之 就 是 将 LLVM IR 转 为 指定 机 器 的 MachineFunction、 
MachineBasicBlock、MachineInstr 实 例 。 这 种 表示 形式 以 最 抽象 的 形式 





包含 了 指令 一 一 操作 人 码 及 一 系列 的 操作 数 。 
eG Te 
YES a 


现在 要 将 LLVM IR 指 令 转 为 机 器 码 指令 ， 即 MachineInstr 类 的 实 
例 。 这 是 对 于 机 器 指令 的 非常 抽象 的 表示 ， 由 一 个 操作 码 和 多 个 操作 数 
而 操作 码 仅仅 只 是 无 符号 整数 (unsigned int) ， 只 能 被 指定 的 后 
端 理解 。 


我 们 来 看 看 MachineInstr.cpp 文 件 中 定义 的 几 个 重要 函数 。 


MachineInstr14 3 phi 25 UI F : 





Machinelnstr::Machinelnstr(MachineFunction &MF, const MCInstrDesc 
&tid, const DebugLoc dl, bool NoImp) 
: MCID(&tid), Parent(nullptr), Operands(nullptr), NumOperands(0 
Flags(0), AsmPrinterFlags(0), 
NumMemRefs(0), MemRefs(nullptr), debugLoc(dl) { 
// 为 预期 数量 的 操作 数 预 留 空间 
if (unsigned NumOps = MCID->getNumOperands() + 
MCID->getNumImplicitDefs() + MCID->getNumImplicitUses()) { 
CapOperands = OperandCapacity: :get(NumOps); 
Operands = MF.allocateOperandArray(CapOperands); 
} 


if (!NoImp) 
addiImplicitDefUseOperands(MF); 








这 个 构造 函数 负责 创建 MachineInstr 类 的 对 象 ， 并 且 增 加 了 隐 式 操 


作 数 。MCInstrDesc 类 指定 了 操作 数 的 数量 ， 因 此 这 个 构造 函数 会 为 操 
作 数 预 留 一 定 的 空间 。 


另 一 种 重要 的 函数 是 addoOperand， 顾 名 思 义 ， 它 为 指令 增加 了 指定 
的 操作 数 。 如 果 是 隐 式 的 操作 数 ， 则 增加 到 操作 数列 表 末 尾 : 如 果 是 显 
式 的 操作 数 ， 则 增加 到 显 式 操 作 数 列表 的 末尾 : 


void MachineInstr::addOperand(MachineFunction &MF, const 
MachineOperand &Op) { 
assert(MCID && "Cannot add operands before providing an instr d 
if (&0p >= Operands && &Op < Operands + NumOperands) { 
MachineOperand CopyOp(0p); 
return addOperand(MF, CopyOp); 


unsigned OpNo - getNumOperands(); 
bool isImpReg = Op.isReg() && Op.isImplicit(); 
if (!isImpReg && !isInlineAsm()) { 
while (OpNo && Operands[OpNo-1].isReg() && Operands[OpNo- 1]. 
isImplicit()) { 
--OpNo,; 
assert(!Operands[OpNo].isTied() && "Cannot move tied operan 
} 
} 


#ifndef NDEBUG 
bool isMetaDataOp = Op.getType() == MachineOperand::MO Metadata 
assert((isImpReg || Op.isRegMask() || MCID->isVariadic() || 
OpNo < MCID->getNumOperands() || isMetaDataOp) && 
"Trying to add an operand to a machine instr that is al 
#endif 


MachineRegisterInfo *MRI = getRegInfo(); 

OperandCapacity OldCap = CapOperands; 

MachineOperand *OldOperands = Operands; 

if (!OldOperands || OldCap.getSize() == getNumOperands()) { 
CapOperands - OldOperands ? OldCap.getNext() : OldCap.get(1); 
Operands - MF.allocateOperandArray(CapOperands); 
if (OpNo) 

moveOperands(Operands, OldOperands, OpNo, MRI); 


} 
if (OpNo != NumOperands) 
moveOperands(Operands + OpNo + 1, OldOperands + OpNo, NumOper 
MRI); 
++NumOperands; 
if (OldOperands != Operands && OldOperands) 


MF.deallocateOperandArray(OldCap, OldOperands); 
MachineOperand *NewMO = new (Operands + OpNo) 
MachineOperand(0p); 
NewMO->ParentMI = this; 
if (NewMO->isReg()) { 
NewMO->Contents.Reg.Prev = nullptr; 
NewMO-»TiedTo = 0; 
if (MRI) 
MRI-»-addRegOperandToUseList(NewMO); 
if (!isImpReg) { 
if (NewMO->isUse()) { 


int Def Idx = MCID- 
>getOperandConstraint(OpNo, MCOI::TIED TO); 
if (DefIdx !- -1) 
tieOperands(DefIdx, OpNo); 
} 
if (MCID- 
>getOperandConstraint(OpHo,MCOI::EARLY_CLOBBER) !- -1) 


NewMO-»setIsEarlyClobber(true); 
} 
} 
} 





目标 架构 也 可 能 存在 内 存 操作 数 〈 内 存 地 址 ) ， 为 了 加 入 内 存 操作 
数 ， 需 要 定义 addMemOprandsO 函 数 : 


void MachineInstr::addMemOperand(MachineFunction &MF, 
MachineMemOperand *MO) { 
mmo iterator OldMemRefs - MemRefs; 
unsigned OldNumMemRefs - NumMemRefs; 
unsigned NewNum = NumMemRefs + 1; 
mmo iterator NewMemRefs = MF.allocateMemRefsArray(NewNum) ; 
std: :copy(OldMemRefs, OldMemRefs + OldNumMemRefs, NewMemRefs); 
NewMemRefs[NewNum - 1] = MO; 
setMemRefs(NewMemRefs, NewMemRefs + NewNum); 


setMemRefs()rK BU i E MachineInstr MemRefs 列 表 的 主要 方法 。 


CE RS 


MachineInstr 类 有 一 个 MCInstrDesc 类 型 的 MCID 成 员 来 描述 指令 ， 
一 个 uint8_t 类 型 的 标识 成 员 ， 一 个 内 存 引 用 成 员 
(mmo_iteratorMemRefs) ， 一 个 std::vector<MachineOperand> 操 作 数 的 
问 量 成 员 。 至 于 成 员 函 数 ，MachineInstr 类 提供 了 : 





。 用 于 信息 查询 的 get** 和 set** 函 数 的 基本 集合 。 例 如 getOpcode()、 
get Num- Operands() 等 。 

e 整体 相关 操作 。 例 如 isInsideBundle()。 

e 检查 指令 是 否 具 有 指定 属性 。 例 如 isVariadic()、isReturn()、isCall() 
Ag 














Xo 
e 机 器 指令 修改 。 例 如 eraseFromParent()。 
e 寄存 器 相关 操作 。 例 如 ubstituteRegister()、addRegisterKilled() 等 。 
。 机 器 指令 创建 方法 。 例 如 addOperand()、setDesc() 等 。 


需要 注意 的 是 ， 虽 然 MachineInstr 类 提供 了 创建 机 器 指令 的 方法 ， 
名 为 BuildMIO 的 专用 有 函数 ， 基 于 MachineInstrBuilder 类 来 说 更 加 方 
便 。 


实现 MachineInstrBuilder 类 


MachineInstrBuilder 类 提供 了 BuildMIO 函 数 ， 用 于 创建 机 器 指令 


,> IE HEZ 
评 细 步 又 

任意 的 机 器 指令 可 以 轻松 地 通过 BuildMI 孙 数 创建 ， 它 位 于 
include/llvm/Code Gen/MachineInstrBuilder.h 文 件 。 

例如 ， 你 可 以 在 代码 片段 中 使 用 BuildMI 函 数 实现 以 下 目的 。 


1. ”创建 一 条 指令 DestReg = mov 42 (在 x86 汇 编码 中 用 mov 
DestReg,42 表 示 ) : 


Machinelnstr *MI = BuildMI(X86::MOV32ri, 1, DestReg).addImm( 42); 


2. 创建 同样 的 指令 ， 但 是 把 它 放 置 于 基本 块 的 最 后 : 


MachineBasicBlock &MBB = 
BuildMI(MBB, X86::MOV32ri, 1, DestReg).addImm(42); 


3. LERF, (EME Tis EPDAT SZ BI: 


MachineBasicBlock::iterator MBBI - 
BuildMI(MBB, MBBI, X86::MOV32ri, 1, DestReg).addImm(42) 


4. 创建 一 个 目 循环 分 文 指令 


BuildMI(MBB, X86::JNE, 1).addMBB(&MBB); 


CHER 


BuildMIQ eA Zit iin 2248 xe Wl asta RREA AK AI VIE 
分 配 ， 同 时 也 需要 指定 操作 数 是 值 还 是 变量 。 





实现 MachineBasicBlock 类 


与 LLVM IR 中 的 基本 块 相 似 ，MachineBasicBlock 类 也 是 由 一 系列 的 
顺序 机 器 指令 组 成 的 ， 事 实 上 大 多 数 情况 下 LLVM IR 的 基本 块 都 是 可 以 
映射 到 MachineBasicBlock 类 的 。 但 是 也 存在 一 些 例外 ， 有 时 候 一 个 
LLVM IR 基本 块 会 映射 到 多 个 MachineBasicBlock 类 。 
MachineBasicBlock 类 提供 了 getBasicBlock() 方 法 ， 返 回 它 映射 到 的 IR 基 
本 块 


详细 步 又 


AAT DAB A BRAS DUAL as WE ARR 
1. getBasicBlock 方 法 返回 当前 的 基本 块 : 


const Bas0069cBlock *getBasicBlock() const { return BB; } 


2; 基本 块 可 能 会 有 前 驱 和 后 继 ， 为 了 记录 下 这 些 ， 定 义 以 下 


vector: 


std::vector<MachineBasicBlock *> Predecessors; 
std: :vector<MachineBasicBlock *> Successors; 


3. insert 函 数 可 以 在 基本 块 中 插入 机 器 指令 : 


MachineBasicBlock::insert(instr iterator I, MachineInstr *MI) { 
assert(!MI->isBundledwithPred( ) && ! MI- 
»isBundledWithSucc() && "Cannot 
insert instruction with bundle flags"); 


if (I != instr end() && I->isBundledwithPred()){ 
MI->setFlag(MachineInstr: :BundledPred) ; 
MI->setFlag(MachineInstr: :BundledSucc) ; 


return Insts.insert(I, MI); 


4. SplitCriticalEdge() K FE Ili FRILL FEY} $48 XE E) Js Ak DER, 
返回 新 创建 的 区 块 ， 当 然 ， 如 果 不 能 分 隔 的 话 束 返回 null。 这 个 函数 更 


新 LiveVariables、MachineDominatorTree、MachineLoopInfo 类 : 


MachineDominatorTree、MachineLoopInfo 类 : 
MachineBasicBlock * 

MachineBasicBlock: :SplitCriticalEdge(MachineBasicBlock 
*Succ, Pass *P) { 


此 函数 的 实现 位 于 lib/CodeGen/MachineBasicBlock.cpp 文 件 中 。 


“CE RS 


如 之 前 所 列举 的 ，MachineBasicBlock 类 的 接口 定义 由 不 同类 型 的 典 
型 函数 组 成 。 它 记载 了 许多 机 器 指令 ， 例 如 typedef ilist<MachineInstr> 
指令 、Insts 指 令 ， 以 及 原始 的 LLVM 基本 块 。 它 提供 了 如 下 方法 。 


。 基本 块 信息 查询 ， 例 如 getBasicBlock()、setHasAddressTaken()。 
。 基 本 块 修改 ， 例 如 moveBefore()、moveAfter()、addSuccessor()。 
。 指令 修改 ， 例 如 push_back()、insertAfter() 等 。 
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e 关于 MachineBasicBlock 类 的 详细 信息 ， 请 参 
JL/ib/CodeGen/Machine- BasicBlock.cpp 文 件 。 


实现 MachineFunction 类 


与 LLVM IR 的 FunctionBlock 类 相似 ，MachineFunction 类 也 包含 了 一 
系列 的 MachineBasicBlock 类 。MachineFunction 类 的 信息 会 映射 到 LLVM 
IR 函 数 ， 作 为 指令 选择 器 的 输入 。 除 基本 块 列 表 之 外 ，MachineFunction 
类 还 包含 了 MachineConstantPool、MachineFrameInfo、 
MachineFunctionInfo, Machine- RegisterInfo25 . 


详细 步 又 


在 MachineFunction 类 中 定义 了 许多 执行 特定 任务 的 函数 ， 也 有 许多 
记录 信息 的 类 对 象 成 员 ， 如 下 。 





。 RegInfo 记 录 函 数 中 使 用 的 寄存 器 信息 
MachineRegisterInfo *RegInfo; 

e MachineFrameInfo 记 录 栈 上 分 配 的 对 象 : 
MachineFrameInfo *FrameInfo; 

e ConstantPoolidacym Hi (spill) 到 内 存 的 常量 : 
MachineConstantPool *ConstantPool; 

e JumpTableInfo 记 录 switch 指 令 的 跳 转 表 : 


MachineJumpTableInfo *JumpTableInfo; 


函数 中 的 基本 块 列表 : 


typedef ilist<MachineBasicBlock> BasicBlockListType; 
BasicBlockListType BasicBlocks; 








e getFunction 函 数 返 回 当前 机 器 码 表示 的 LLVM 函 数 : 


const Function *getFunction() const { return Fn; } 


e CreateMachinelnstr7} fc Xr HY) MachineInstrZ5: 


Machinelnstr *CreateMachineInstr(const MCInstrDesc &MCID, 
DebugLoc DL, 
bool NoImp = false); 


LR ELPR 


MachineFunction 类 主要 是 保存 MachineBasicBlock 对 象 的 列表 

(typedef ilist<MachineBasicBLock> BasicBlockListType; 
BasicBlockListType BasicBlocks;) ， 为 检索 机 器 函数 和 修改 基本 块 成 员 
中 的 对 象 定义 提供 了 多 个 方法 。 还 需要 着 重 注意 的 一 点 是 ， 
MachineFunction 类 还 为 函数 中 的 基本 块 维护 了 一 个 控制 流 图 Ccontrol 
flow graph 一 一 CFG)。 这 个 控制 流 图 为 许多 优化 和 分 析 提 供 了 重要 的 
控制 流 信 息 。 此 理解 MachineFunction 对 象 及 相应 的 控制 流 图 的 构建 是 
相当 重要 的 。 
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e 关于 MachineFunction 类 的 具体 实现 ， 请 参见 lib/CodeGen/Machine- 
Function.cpp 文 件 。 
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为 了 进行 指令 选择 ，LLVM 用 一 种 底层 的 数据 相关 的 DAG 结 构 
SelectionDAG 来 表示 LLVM ”IR。 在 SelectionDAG 上 能 够 实施 各 种 简化 
的 、 平 台 相 关 的 优化 。SelectionDAG 是 平台 无 关 的 、 简 单 的 、 强 大 的 表 
示 ， 能 够 在 把 IR lowering 到 特定 平台 时 发 挥 重要 作用 。 


详细 步 又 


下 面 的 代码 展示 了 SelectionDAG 类 的 基本 结构 ， 包 括 它 的 数据 成 
员 ， 从 类 中 设置 或 检索 有 效 信息 的 各 种 函数 ，SelectionDAG 类 定义 如 
下 : 











class SelectionDAG { 

const TargetMachine &TM; 

const TargetLowering &TLI; 

const TargetSelectionDAGInfo &TSI; 
MachineFunction *MF; 

LLVMContext *Context; 
CodeGenOpt::Level OptLevel; 


SDNode EntryNode; 
// Root 一 整个 DAG 的 根 节 点 
SDValue Root; 


// AllNodes—"fDAG Ti xis ze 
ilist«SDNode» AllNodes; 








// NodeAllocatorType 一 我 们 使 用 的 分 配 SDNode 的 分 配器 类 型 
typedef RecyclingAllocator<BumpPtrAllocator, SDNode, 
sizeof(LargestSDNode), 

AlignOf<MostAlignedSDNode>: :Alignment> 
NodeAllocatorType; 

BumpPtrAllocator OperandAllocator; 


BumpPtrAllocator Allocator; 


SDNodeOrdering *Ordering; 

public: 

struct DAGUpdateListener { 
DAGUpdateListener *const Next; 

SelectionDAG &DAG; 

explicit DAGUpdateListener(SelectionDAG &D) 


Next(D.UpdateListeners), DAG(D) { 
DAG.UpdateListeners = this; 


} 


private: 
friend struct DAGUpdateListener; 


DAGUpdateListener *UpdateListeners; 
void init(MachineFunction &mf); 


// 设置 SelectionDAG 根 节点 的 函数 
const SDValue &setRoot(SDValue N) { 


assert((!N.getNode() || N.getValueType() == MVT::Other) && 


"DAG root value is not a chain!"); 

if (N.getNode()) 
checkForCycles(N.getNode()); 

Root = N; 

if (N.getNode() ) 
checkForCycles(this); 

return Root; 


j 


void Combine(CombineLevel Level, AliasAnalysis &AA, 


CodeGenOpt::Level OptLevel); 


SDValue getConstant(uint64 t Val, EVT VT, bool isTarget 


SDValue getConstantFP(double Val, EVT VT, bool isTarget 


false); 


false); 


SDValue getGlobalAddress(const GlobalValue *GV, DebugLoc DL, EVT 


VT, int64 t offset = 0, bool isTargetGA = false, 
unsigned char TargetFlags - 0); 


SDValue getFramelndex(int FI, EVT VT, bool isTarget 


false); 


SDValue getTargetIndex(int Index, EVT VT, int64_t Offset = 0, 
unsigned char TargetFlags = 0); 





// 此 函数 返回 与 这 个 MachineBasicBlock 对 应 的 基本 块 





SDValue getBasicBlock(MachineBasicBlock *MBB); 


SDValue getBasicBlock(MachineBasicBlock *MBB, DebugLoc dl); 
SDValue getExternalSymbol(const char *Sym, EVT VT); 


SDValue getExternalSymbol(const char *Sym, DebugLoc dl, EVT VT); 


SDValue getTargetExternalSymbol(const char *Sym, EVT VT, 
unsigned char TargetFlags - 0); 


// 此 函数 返回 这 个 SelectionDAG 节 点 对 应 的 值 的 类 型 
SDValue getValueType(EVT); 


SDValue getRegister(unsigned Reg, EVT VT); 

SDValue getRegisterMask(const uint32 t *RegMask); 

SDValue getEHLabel(DebugLoc dl, SDValue Root, MCSymbol *Label); 
SDValue getBlockAddress(const BlockAddress *BA, EVT VT, 

int64 t Offset = 0, bool isTarget = false, 

unsigned char TargetFlags - 0); 

SDValue getSExtOrTrunc(SDValue Op, DebugLoc DL, EVT VT); 
SDValue getZExtOrTrunc(SDValue Op, DebugLoc DL, EVT VT); 


SDValue getZeroExtendInReg(SDValue Op, DebugLoc DL, EVT SrcTy); 


SDValue getNOT(DebugLoc DL, SDValue Val, EVT VT); 





// 此 函数 获得 SelectionDAG 节 点 
SDValue getNode(unsigned Opcode, DebugLoc DL, EVT VT); 


SDValue getNode(unsigned Opcode, DebugLoc DL, EVT VT, SDValue N); 


SDValue getNode(unsigned Opcode, DebugLoc DL, EVT VT, SDValue N1, 
SDValue N2); 


SDValue getNode(unsigned Opcode, DebugLoc DL, EVT VT, 
SDValue N1, SDValue N2, SDValue N3); 


SDValue getMemcpy(SDValue Chain, DebugLoc dl, SDValue Dst, SDValu 


Src,SDValue Size, unsigned Align, bool isVol, bool AlwaysInline, 
MachinePointerInfo DstPtrinfo,MachinePointerInfo SrcPtrInfo); 


SDValue getAtomic(unsigned Opcode, 


SDValue Ptr, SDValue Cmp, SDValue Swp, 
MachinePointerlInfo Ptrinfo, unsigned Alignment, 
AtomicOrdering Ordering, 

SynchronizationScope SynchScope); 


SDNode *UpdateNodeOperands(SDNode *N, SDValue 0p); 


SDNode *UpdateNodeOperands(SDNode *N, 


SDNode *UpdateNodeOperands(SDNode *N, 


SDValue 0p3); 


SDNode *SelectNodeTo(SDNode *N, unsigned TargetOpc, EVT VT); 


SDNode *SelectNodeTo(SDNode *N, unsigned TargetOpc, EVT VT, 


SDNode *SelectNodeTo(SDNode *N, unsigned TargetOpc, EVT VT, 
SDValue Opi, SDValue 0p2); 


MachineSDNode *getMachineNode(unsigned Opcode, DebugLoc dl, 
MachineSDNode *getMachineNode(unsigned Opcode, DebugLoc dl, 
SDValue 0p1); 


MachineSDNode *getMachineNode(unsigned Opcode, DebugLoc dl, 
SDValue Opi, SDValue 0p2); 


void 


void 


void 


bool 


bool 


bool 


bool 


ReplaceAllUsesWith(SDValue From, SDValue 0p); 
ReplaceAllUsesWith(SDNode *From, SDNode *To); 
ReplaceAllUsesWith(SDNode *From, const SDValue *To); 
isBaseWithConstantOffset(SDValue Op) const; 
isKnownNeverNaN(SDValue Op) const; 
isKnownNeverZero(SDValue Op) const; 


isEqualTo(SDValue A, SDValue B) const; 


SDValue UnrollVectorOp(SDNode *N, unsigned ResNE = 0); 


bool 


isConsecutiveLoad(LoadSDNode *LD, LoadSDNode *Base, 


DebugLoc dl, EVT MemVT, SDValu 


SDValue Opi, SDValue Op2); 


SDValue Opi, SDValue Op2, 


SDVal 


EVT V 


unsigned Bytes, int Dist) const; 

unsigned InferPtrAlignment(SDValue Ptr) const; 

private: 

bool RemoveNodeFromCSEMaps(SDNode *N); 

void AddModifiedNodeToCSEMaps(SDNode *N); 

SDNode *FindModifiedNodeSlot(SDNode *N, SDValue Op, void *&Insert 


SDNode *FindModifiedNodeSlot(SDNode *N, SDValue Op1, SDValue Op2, 
void *&InsertPos); 


SDNode *FindModifiedNodeSlot(SDNode *N, const SDValue *Ops, 
unsigned NumOps,void *&InsertPos); 


SDNode *UpdadeDebugLocOnMergedSDNode(SDNode *N, DebugLoc loc); 
void DeleteNodeNotInCSEMaps(SDNode *N); 


void DeallocateNode(SDNode *N); 
unsigned getEVTAlignment(EVT MemoryVT) const; 


void allnodes clear(); 
std::vector«SDVTList» VTList; 
std::vector«CondCodeSDNode*» CondCodeNodes; 
std::vector«SDNode*» ValueTypeNodes; 


std::map«EVT, SDNode*, EVT::compareRawBits> ExtendedValueTypeNode 
StringMap<SDNode*> ExternalSymbols; 


std: :map<std::pair<std::string, unsigned char>,SDNode*> 
TargetExternalSymbols; 
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之 前 的 代码 展示 了 SelectionDAG 类 的 多 个 平台 无 关 的 创建 多 种 








SDNode 的 方法 ， 以 及 检索 、 计 算 SelectionDAG 图 节点 有 用 信息 的 方 

法 ， 由 SelectionDAG 类 提供 的 更 新 、 蔡 换 方法 。 这 些 方法 大 多 数 定义 于 
SelectionDAG.cpp 文 件 中 。 需 要 注意 的 是 ，SelectinoDAG 图 及 它 的 节点 
类 型 SDNode， 被 设计 用 于 既 可 以 存储 平台 无 关 的 信息 ， 也 可 以 存储 特 
定 平 台 的 信息 。 例 如 ，SDNode 类 的 isTargetOpcode0 和 isMachine 
Opcode() 方 法 用 于 判断 操作 码 是 否 为 目标 平台 的 操作 码 或 者 平台 无 关 的 
机 器 码 。 这 是 因为 虽然 是 同一 种 类 类 型 NodeType， 但 是 范围 不 同 ， 所 
以 既 用 于 表达 真实 平台 的 操作 码 ， 也 用 于 表达 机 器 指令 的 操作 人 码 。 




















合法 化 SelectionDAG 


SelectionDAG 是 指令 和 操作 数 的 、 平 台 无 关 的 表示 。 但 是 ， 目 标 平 
台 往 往 不 能 完全 文 持 其 中 的 指令 和 数据 类 型 。 因 此 ， 我 们 把 初始 构建 的 
SelectionDAG 图 中 目标 平台 不 文 持 的 指令 称 为 非法 指令 。 非 法 DAG 需 要 
经 过 DAG 合 法 化 的 步骤 ， 转 为 目标 架构 完全 文 持 的 合法 DAG。 


DAG 合 法 化 有 两 种 方式 来 把 不 文 持 的 数据 类 型 转 为 文 持 的 : 一 种 是 
提升 promoting) 将 小 的 数 一 一 据 类 型 提升 为 大 的 数据 类 型 ， 男 一 种 就 
是 把 大 的 数据 类 型 缩减 为 小 的 数据 类 型 。 例 如 ， 如 果 目 标 架 构 仅 文 持 32 
位 整数 数据 类 型 ， 那 么 对 于 DAG 中 的 8 位 整数 或 16 位 整数 这 样 小 的 数据 
类 型 ， 就 需要 提升 到 32 位 整数 类 型 来 表达 。 而 大 的 数据 类 型 ， 例 如 64 位 
整数 ， 就 扩展 到 用 两 个 32 位 整数 数据 类 型 来 表达 。 在 提升 和 扩展 数据 类 
型 的 过 程 中 ，Sign 和 zero 也 要 加 上 ， 使 得 结果 保持 一 致 。 

类 似 地 ， 向 量 类 型 可 以 通过 切 分 为 更 小 的 问 量 (从 问 量 中 提取 元 
A) 或 者 拓宽 小 的 问 量 类 型 转 为 大 的 、 已 支持 的 癌 量 类 型 来 合法 化 。 如 
A ABZ FY DAFEIR$ F8] ey RE A 76 8 d A 8 
形式 。 


合法 化 阶段 也 能 命令 这 种 类 型 的 寄存 器 类 来 文 持 给 定 的 数据 。 


详细 步 又 


SelectionDAGLegalize 类 有 多 个 数据 成 员 ， 用 来 记录 合法 的 节点 ， 
以 及 合法 化 节点 的 各 种 方法 。 下 面 的 合法 化 阶段 代码 快照 来 自 LLVM 代 
人 码 库 ， 展 示 了 合法 化 实现 的 基本 框 染 : 




















namespace { 
class SelectionDAGLegalize : public 
SelectionDAG: :DAGUpdateListener { 


const TargetMachine &TM; 


const TargetLowering &TLI; 
SelectionDAG &DAG; 


SelectionDAG: :allnodes_iterator LegalizePosition; 





// LegalizedNodes: 已 经 合法 化 的 节点 集合 
SmallPtrSet«SDNode *, 16> LegalizedNodes; 





public: 

explicit SelectionDAGLegalize(SelectionDAG &DAG); 
void LegalizeDAG(); 

private: 

void LegalizeOp(SDNode *Node); 

SDValue OptimizeFloatStore(StoreSDNode *ST); 


// 合法 化 加 载 操作 
void LegalizeLoadOps(SDNode *Node); 


// 合法 化 存储 操作 
void LegalizeStoreOps(SDNode *Node); 














// 操作 Selection DAG 节 点 的 主要 合法 化 函数 
void SelectionDAGLegalize: :LegalizeOp(SDNode *Node) { 
// 目标 节点 (常数 ) 需要 更 进一步 地 合理 化 












































if (Node->getOpcode() == ISD: : TargetConstant) 
return; 
for (unsigned i = 0, e = Node-»getNumValues(); i !- e; ++1) 


assert(TLI.getTypeAction(*DAG.getContext(), Node- 
>getValueType(i)) 
== TargetLowering::TypeLegal && "Unexpected illegal type!"); 


for (unsigned i = ©, e = Node->getNumOperands(); i != e; ++i) 
assert((TLI.getTypeAction(*DAG.getContext(), 
Node- 
>getOperand(i).getValueType()) == TargetLowering::TypeLegal | | 
Node->getOperand(1i).getOpcode() == ISD::TargetConstant) && 
"Unexpected illegal type!"); 


TargetLowering: :LegalizeAction Action = TargetLowering::Legal; 
bool SimpleFinishLegalizing = true; 


// 基于 指令 操作 码 的 合法 化 
switch (Node->getOpcode()) ( 














case ISD::INTRINSIC W CHAIN: 
case ISD::INTRINSIC WO CHAIN: 
case ISD::INTRINSIC VOID: 
case ISD::STACKSAVE: 
Action = TLI.getOperationAction(Node->getOpcode(), 
MVT: :Other ) ; 
break; 


“CHE RS 
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例如 Lega lizeOp， 这 些 信息 由 egalize 类 的 const 
TargetLowering &TLIPÉ 数 提供 其 他 的 成 员 也 许 会 依赖 const 
TargetMachine &TM 函 数 ) 。 我 们 来 看 看 合 法 化 过 各 是 如 何 进行 的 。 


具体 的 合法 化 有 两 种 : 类 型 合法 化 和 指令 合法 化 。 首 先 来 看 看 类 型 
合法 化 。 使 用 如 下 命令 创建 一 个 test.] 文件 : 


$ cat test.11 

define i64 Qtest(i64 %a, i164 *b, i64 %c) { 
%add = add nsw i64 %a, %b 
%div = sdiv i164 %add, %c 
ret 164 %div 

} 





这 个 例子 中 的 数据 类 型 是 i64， 对 于 x86 平 台 来 说 ， 仅 仅 文 持 32 位 数 
据 类 型 ， 因 此 i64 这 个 数据 类 型 是 非法 的 。 为 了 运行 这 段 代 码 ， 数 据 类 
型 需要 转 为 32， 这 在 DAG 合 法 化 阶段 完成 。 


执行 以 下 命令 ， 查 看 类 型 合法 化 之 前 的 DAG: 





$ llc -view-dag-combine1-dags test.11l 


下 图 是 类 型 合法 化 之 前 的 DAG: 


执行 以 下 命令 ， 查 看 类 型 合法 化 之 后 的 DAG: 


$ llc -view-dag-combine2-dags test.11l 


下 图 是 类 型 合法 化 之 后 的 DAG: 


如 果 仔 细 观 察 DAG 节 点 ， 你 会 发 现在 合法 化 之 前 的 每 个 操作 都 有 
i64 类 型 ， 这 是 因为 IR 有 i64 数 据 类 型 ， 而 DAG 节 点 和 IR 指 令 是 一 一 对 应 
的 。 但 是 目标 机 器 x86 仅 支持 记 2 类 型 (32 位 整数 类 型 ) 。 在 DAG 合 法 化 
阶段 ， 不 文 持 的 i64 类 型 被 转 为 已 文 持 的 让 2 类 型 。 这 个 操作 称 为 类 型 扩 
展 Cexpanding) 将 较 大 的 类 型 分 解 为 较 小 的 类 型 。 例 如 ， 在 仅 支 持 
i32 值 的 目标 平台 上 ，i64 类 型 的 值 都 被 分 解 成 一 对 i32 类 型 的 值 。 因 此 ， 
在 合法 化 之 后 ， 所 有 的 操作 仪 包含 i32 数 据 类 型 了 。 


" 接 下 来 让 我 们 看 看 指令 是 如 何 合法 化 的 ， 用 以 下 命令 创建 test.11 文 








$ cat test.11 

define i32 Qtest(i32 %a, i32 %b, i32 %c) { 
%add = add nsw 132 %a, %b 
%div = sdiv i32 %add, %c 
ret 132 %div 


执行 以 下 命令 ， 查 看 合法 化 之 前 的 DAG: 


$ llc -view-dag-combinei-dags test.11 


下 图 是 合法 化 之 前 的 DAG: 


执行 以 下 命令 ， 碍 看 合法 化 之 后 的 DAG: 
$ llc -view-dag-combine2-dags test.11l 


下 图 是 合法 化 之 后 的 DAG: 


在 指令 合法 化 之 前 ，DAG 中 包含 sdiv 指 令 。 但 对 于 x86 目 标 平 台 来 
说 ， 是 不 支持 sdiv 指 令 的 ， 因 此 它 是 非法 的 。 但 是 ， 由 于 x86 支 持 
sdivrem 指 令 ， 在 合法 化 阶段 sdiv 指 令 就 被 转 为 了 sdivrem 指 令 ， 如 前 面 的 
两 个 DAG 所 示 。 


优化 SelectionDAG 


SelectionDAG 表 达 以 节点 的 形式 存储 了 数据 和 指令 信息 。 与 LLVM 
IR 的 InstCombinePass 类 似 ， 这 些 节点 也 可 以 合并 并 优化 ， 得 到 最 小 化 的 
SelectionDAG 。 不 过 不 仅 只 有 DAGCombine 操 作 来 优化 SelectionDAG。 
在 DAGLegalize〈 合 法 化 DAG) 过 程 中 可 能 会 产生 一 些 元 余 的 DAG 节 
点 ， 这 也 需要 在 随后 的 DAG 优 化 Pass 消 除 。 最 后 得 到 的 SelectionDAG 会 
更 加 简洁 高 效 。 


详细 步 又 


在 DAGCombine 类 中 有 许多 类 似 visit**() 的 成 员 函 数 ， 通 过 折 苇 
(folding) 、 重 调度 (reordering) 、 合 并 (combining) 、 修 改 SDNode 
节点 来 执行 优化 。 需 要 注意 的 是 ， 从 DAGCombiner 的 构造 函数 中 可 以 猜 
到 ， 我 们 可 以 猜测 一 些 优化 需要 别名 分 析 的 信息 。 








class DAGCombiner { 
SelectionDAG &DAG; 

const TargetLowering &TLI; 
CombineLevel Level; 
CodeGenOpt::Level OptLevel; 
bool LegalOperations; 

bool LegalTypes; 


SmallPtrSet«SDNode*, 64» WorkListContents; 
SmallVector«SDNode*, 64» WorkListOrder; 


AliasAnalysis &AA; 


// 将 SDNodes 用 户 加 入 worklist 
void AddUsersToWorkList(SDNode *N) { 
for (SDNode::use_iterator UI = N->use_begin(), 
UE = N->use_end(); UI != UE; ++UI) 
AddToWorkList(*UI); 


} 
SDValue visit(SDNode *N); 


public: 


void AddToWorkList(SDNode *N) { 
WorkListContents.insert(N); 
WorkListOrder.push_back(N); 

} 

void removeFromWorkList(SDNode *N) { 
WorkListContents.erase(N); 


j 


// SDNode 合 并 操作 
SDValue CombineTo(SDNode *N, const SDValue *To, unsigned NumTo, 
bool AddTo = true); 





SDValue CombineTo(SDNode *N, SDValue Res, bool AddTo = true) { 
return CombineTo(N, &Res, 1, AddTo); 


} 
SDValue CombineTo(SDNode *N, SDValue ResO, SDValue Resi, 
bool AddTo = true) { 

SDValue To[] = { ResO, Resi }; 

return CombineTo(N, To, 2, AddTo); 


j 


void CommitTargetLoweringOpt(const TargetLowering::TargetLowering 
&TLO); 


private: 
bool SimplifyDemandedBits(SDValue Op) { 

unsigned BitWidth - 
Op.getValueType().getScalarType().getSizeInBits(); 


APInt Demanded = APInt::getAllOnesValue(BitWidth); 
return SimplifyDemandedBits(Op, Demanded); 


Bodl SimplifyDemandedBits(SDValue Op, const APInt &Demanded); 
bool CombineToPreIndexedLoadStore(SDNode *N); 

bool CombineToPostIndexedLoadStore(SDNode *N); 

void ReplaceLoadwithPromotedLoad(SDNode *Load, SDNode *ExtLoad); 
SDValue PromoteOperand(SDValue Op, EVT PVT, bool &Replace); 
SDValue SExtPromoteOperand(SDValue Op, EVT PVT); 

SDValue ZExtPromoteOperand(SDValue Op, EVT PVT); 


SDValue PromoteIntBinOp(SDValue Op); 


SDValue PromoteIntShiftOp(SDValue Op); 

SDValue PromoteExtend(SDValue Op); 

bool PromoteLoad(SDValue 0p); 

void ExtendSetCCUses(SmallVector«SDNode*, 4» SetCCs, 
SDValue Trunc, SDValue ExtLoad, DebugLoc DL, 
ISD::NodeType ExtType); 


SDValue combine(SDNode *N); 








// 操作 由 SD 节点 表示 的 指令 的 多 个 visit 函 数 ， 与 TR 层面 的 指令 组 合 相 似 
SDValue visitTokenFactor(SDNode *N); 
SDValue visitMERGE_VALUES(SDNode *N); 














SDValue visitADD(SDNode *N); 
SDValue visitSUB(SDNode *N); 
SDValue visitADDC(SDNode *N); 
SDValue visitSUBC(SDNode *N); 
SDValue visitADDE(SDNode *N); 
SDValue visitSUBE(SDNode *N); 
SDValue visitMUL(SDNode *N); 


public: 


DAGCombiner(SelectionDAG &D, AliasAnalysis &A, CodeGenOpt::Level 
DAG(D), TLI(D.getTargetLoweringInfo()), Level(BeforeLegalizeTyp 
OptLevel(OL), LegalOperations(false), LegalTypes(false), AA(A) 


// 对 以 下 操作 的 Selection DAG 转 换 
SDValue DAGCombiner::visitMUL(SDNode *N) { 
SDValue NO = N-»getOperand(0); 
SDValue N1 = N-»getOperand(1); 
ConstantSDNode *NOC = dyn_cast<ConstantSDNode>(NO); 
ConstantSDNode *N1C = dyn_cast<ConstantSDNode>(N1); 
EVT VT = NO.getValueType(); 
if (VT.isVector()) { 
SDValue FoldedVOp = SimplifyVBinOp(N); 
if (FoldedVOp.getNode()) return FoldedVOp; 


} 
if (NO.getOpcode() == ISD::UNDEF || N1.getOpcode() == ISD::UNDE 
return DAG.getConstant(0, VT); 


if (NOC && N1C) 
return DAG.FoldConstantArithmetic(ISD::MUL, VT, NOC, N1C); 


if (NOC && !N1C) 


return DAG.getNode(ISD::MUL, N->getDebugLoc(), VT, N1, NO); 


if (NIC && N1C->isNullValue() ) 
return N1; 


if (N1C && N1C-»isAllOnesValue()) 
return DAG.getNode(ISD::SUB, N->getDebugLoc(), VT, 
DAG.getConstant(0, VT), NO); 
if (N1C && N1C-»getAPIntValue().isPowerOf2()) 
return DAG.getNode(ISD::SHL, N->getDebugLoc(), VT, NO, 
DAG.getConstant(N1C-»2getAPIntValue().logBase2(), 
getShiftAmountTy(NO.getValueType()))); 


if (N1C && (-N1C-»getAPIntValue()).isPowerOf2()) { 
unsigned Log2Val = (-Ni1C-»getAPIntValue()).logBase2(); 
return DAG.getNode(ISD::SUB, N->getDebugLoc(), VT, 
DAG.getConstant(0, VT), 
DAG.getNode(ISD::SHL, N->getDebugLoc(), VT, NO, 
DAG.getConstant(Log2Val, getShiftAmountTy(NO.getValueType() 


if (N1C && NO.getOpcode() == ISD::SHL && 
isa«ConstantSDNode»(NO.getOperand(1))) { 
SDValue C3 - DAG.getNode(ISD::SHL, N- 
>getDebugLoc(), VT, N1, 
NO.getOperand(1)); 

AddToWorkList(C3.getNode()); 

return DAG.getNode(ISD::MUL, N->getDebugLoc(), VT, 
NO.getOperand(0), C3); 


if (NO.getOpcode() -- ISD::SHL && 
isa«ConstantSDNode»(NO.getOperand(1)) && 
NO.getNode()->hasOneUse()) { 
Sh = NO; Y = N1; 
} else if (N1.getOpcode() == ISD::SHL && 
isa<ConstantSDNode>(N1.getOperand(1)) && 
N1.getNode()->hasOneUse()) { 
Sh = N1; Y = NO; 


j 
if (Sh.getNode()) { 
SDValue Mul = DAG.getNode(ISD::MUL, N->getDebugLoc(), VT, 
Sh.getOperand(0), Y); 
return DAG.getNode(ISD::SHL, N->getDebugLoc(), VT, 
Mul, Sh.getOperand(1)); 


j 


} 
if (NIC && NO.getOpcode() == ISD::ADD && NO.getNode()- >hasOn 


isa<ConstantSDNode>(NO.getOperand(1) ) ) 
return DAG.getNode(ISD::ADD, N->getDebugLoc(), VT, 
DAG.getNode(ISD::MUL, NO.getDebugLoc(), 
VT, NO.getOperand(0), N1), DAG.getNode(ISD::MUL, 
N1.getDebugLoc(), VT, NO.getOperand(1), N1)); 


SDValue RMUL - ReassociateOps(ISD::MUL, N- 
>getDebugLoc(), NO, N1); 


if (RMUL.getNode() !- 0) return RMUL; 


return SDValue(); 
} 


“CE RS 


如 前 面 的 代码 所 示 ， 一 些 DAGCombine Pass 会 寻找 特定 的 模式 ， 然 
后 把 这 些 模式 折 对 成 一 个 DAG。 基 本 上 这 样 可 以 减少 DAG 的 数量 ， 同 
时 lowering DAG。 得 到 的 结果 是 优化 过 的 SelectionDAG 类 。 
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。 关于 优化 的 SelectionDAG 类 的 具体 实现 ， 请 参见 
lib/CodeGen/Selection DAG/DAGCombiner.cpp 文 件 。 


基于 DAG 的 指令 选择 


TE 合法 化 和 DAG 合 并 之 后 ， SelectionDAG 已 经 被 优化 了 。 但 指令 依 

是 平台 无 关 的 ， 需 要 映射 到 平台 相关 的 指令 。 而 指令 选择 阶段 将 采用 
i US 匹配 特定 的 模式 ， 将 其 映射 到 特定 平台 
的 DAG 输 出 节点 。 


TableGen ”DAG 指令 选择 器 从 .td 文件 读 入 指令 模式 ， 上 自动 化 构建 部 
分 的 模式 匹配 代码 。 


EAR 


SelectionDAGISel3e fESelectionDAG 的 基础 上 ， 进 行 基于 模式 匹配 
的 指令 选择 器 的 通用 基 类 ， 它 继承 了 MachineFunctionPass 类 多 ^N PÉ 
oe UHE) 的 合法 性 和 优化 收益 。 下 面 是 这 类 的 基 
EA: 











class SelectionDAGISel : public MachineFunctionPass { 
public: 

const TargetMachine &TM; 

const TargetLowering &TLI; 

const TargetLibraryInfo *LibInfo; 
FunctionLoweringInfo *FuncInfo; 
MachineFunction *MF; 
MachineRegisterInfo *RegInfo; 
SelectionDAG *CurDAG; 
SelectionDAGBuilder *SDB; 
AliasAnalysis *AA; 

GCFunctionInfo *GFI; 
CodeGenOpt::Level OptLevel; 
static char ID; 


explicit SelectionDAGISel(const TargetMachine &tm, 
CodeGenOpt::Level OL = CodeGenOpt: :Default); 


virtual -SelectionDAGISel(); 


const TargetLowering &getTargetLowering() { return TLI; } 
virtual void getAnalysisUsage(AnalysisUsage &AU) const; 


virtual bool runOnMachineFunction(MachineFunction &MF); 
virtual void EmitFunctionEntryCode() {} 

virtual void PreprocessISelDAG() {} 

virtual void PostprocessISelDAG() {} 

virtual SDNode *Select(SDNode *N) = 0; 


virtual bool SelectInlineAsmMemoryOperand(const SDValue &Op, 
char ConstraintCode, 
std::vector«SDValue» &OutOps) ( 

return true; 


j 


virtual bool IsProfitableToFold(SDValue N, SDNode *U, SDNode *Roo 


static bool IsLegalToFold(SDValue N, SDNode *U, SDNode *Root, 
CodeGenOpt::Level OptLevel, 
bool IgnoreChains - false); 


enum BuiltinOpcodes ( 

OPC Scope, 

OPC RecordNode, 

OPC CheckOpcode, 

OPC SwitchOpcode, 

OPC CheckFoldableChainNode, 

OPC EmitInteger, 

OPC EmitRegister, 

OPC EmitRegister2, 

OPC EmitConvertToTarget, 

OPC EmitMergeInputChains, 

3 

static inline int getNumFixedFromVariadicInfo(unsigned Flags) { 
return ((Flags&OPFL VariadicInfo) »» 4)-1; 


protected: 
// DAGSize 一 进行 指令 选择 的 DAG 的 大 小 
unsigned DAGSize; 


void ReplaceUses(SDValue F, SDValue T) { 
CurDAG->ReplaceAllUsesOfValueWith(F, T); 


j 


void ReplaceUses(const SDValue *F, const SDValue *T, unsigned Num 
CurDAG-»-ReplaceAllUsesOfValuesWith(F, T, Num); 


j 


void ReplaceUses(SDNode *F, SDNode *T) { 
CurDAG-»-ReplaceAllUsesWith(F, T); 


j 


void SelectInlineAsmMemoryOperands(std::vector«SDValue» &O0ps); 
public: 

bool CheckAndMask(SDValue LHS, ConstantSDNode *RHS, 

int64_t DesiredMaskS) const; 


bool CheckOrMask(SDValue LHS, ConstantSDNode *RHS, 
int64_t DesiredMaskS) const; 


virtual bool CheckPatternPredicate(unsigned PredNo) const { 
llvm unreachable("Tblgen should generate the implementation of 


j 


virtual bool CheckNodePredicate(SDNode *N, unsigned PredNo) const 
llvm unreachable("Tblgen should generate the implementation of 


vars: 

SDNode *Select INLINEASM(SDNode *N); 
SDNode *Select UNDEF(SDNode *N); 
void CannotYetSelect(SDNode *N); 


void DoInstructionSelection(); 


SDNode *MorphNode(SDNode *Node, unsigned TargetOpc, SDVTList VTs, 
const SDValue *Ops, unsigned NumOps, unsigned EmitNodeInfo); 


void PrepareEHLandingPad(); 
void SelectAllBasicBlocks(const Function &Fn); 


bool TryToFoldFastISelLoad(const LoadInst *LI, const Instruction 
*FoldInst, FastISel *FastIS); 


void FinishBasicBlock(); 


void SelectBasicBlock(BasicBlock::const iterator Begin, 


BasicBlock::const_iterator End, 
bool &HadTailCall); 


void CodeGenAndEmitDAG(); 
void LowerArguments(const BasicBlock *BB); 
void ComputeLiveOutVRegInfo(); 


ScheduleDAGSDNodes *CreateScheduler(); 
J; 
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指令 选择 阶段 需要 把 平台 无 关 的 指令 转换 为 特定 平台 的 指令 。 
TableGen 类 帮助 选择 特定 平台 的 指令 。 这 个 阶段 基本 束 是 匹配 平台 无 关 
的 输入 节点 ， 输 出 特定 平台 文 持 的 节点 。 


函数 调用 DoInstructionSelection(0) 函 数 ， 通 
历 DAG 节 点 并 对 每 个 节点 调用 SelectO 困 数 ， 如 下 : 














SDNode *ResNode = Select(Node); 


Select() 函 数 是 需要 由 特定 平台 实现 的 抽象 方法 。x86 日 标 平 台 实现 
了 X86DAGToDAGISel::Select0 函 数 。 这 个 函数 拦截 一 部 分 节点 进行 手 
动 匹 配 ， 而 大 部 分 工作 则 委托 给 X86DAGToDAGISel::SelectCode0O) 函 数 
完成 o 


X86DAGToDAGISel::SelectCode K # HH TableGen ER. CAF 
一 个 匹配 表 ， 随 后 调用 SelectionDAGISel::SelectCodeCommonO 泛 型 函 
数 ， 并 把 匹配 表 传 给 它 。 


例如 : 


$ cat test.11 

define i32 Qtest(i32 %a, 132 %b, 132 %c) { 
%add = add nsw i32 %a, 96b 

%div = sdiv 132 %add, %c 


ret 132 %div 
} 


执行 以 下 命令 ， 碍 看 指令 选择 之 前 的 DAG: 
$ llc -view-isel-dags test.11 


下 图 是 指令 选择 之 前 的 DAG: 


执行 以 下 命令 ， 查 看 指令 选择 之 后 的 DAG: 
$ llc -view-sched-dags test.11 


下 图 是 指令 选择 之 后 的 DAG 


可 以 看 到 ， 在 指令 选择 阶段 Load 操 作 被 转换 为 MOV32rm 机 器 码 。 
LI N 
男 请 参阅 


e 关于 指令 选择 的 具体 实现 ， 请 参见 lib/CodeGen/SelectionDAG/Selec- 
tionDAGISel.cpp 文 件 。 


基于 SelectionDAG 的 指令 调度 


到 现在 为 止 ， 我 们 的 SelectionDAG 节 点 已 经 由 目标 平台 所 支持 的 指 
令 和 操作 数 所 组 成 了 。 人 但是， 代码 仍然 是 DAG 形 式 的 。 目 标 架 构 以 序列 
执行 代码 。 所 以 ， 下 一 步 就 是 对 SelectionDAG 的 节点 进行 调度 。 


调度 器 负责 安排 DAG 中 指令 的 执行 顺序 。 在 此 过 程 中 ， 它 考虑 各 种 
启发 式 优化 ， 例 如 寄存 器 压力 ， 以 优化 指令 执行 顺序 、 最 小 化 指令 执行 
的 延迟 时 间 。 在 安排 了 DAG 节 点 的 执行 顺序 之 后 ，DAG 节 点 转 为 
MachineInstrs 列 表 并 且 SelectionDAG 节 点 被 解构 。 


详细 步 又 


在 ScheduleDAG.h 中 定义 了 多 个 基本 结构 ， 在 ScheduleDAG.cpp 文 件 
中 实现 。ScheduleDAG 类 束 是 一 个 调度 器 基 类 ， 被 其 他 调度 器 继承 ， 它 
仅仅 提供 了 关于 图 的 修改 操作 ， 例 如 迭代 器 、DEFS、 拓 扑 排序 、 移 动 周 
围 节 点 的 函数 等 。 














class ScheduleDAG { 

public: 
const TargetMachine &TM; // 目标 平台 处 理 器 
const TargetInstrInfo *TII; // 目标 平台 指令 
const TargetRegisterInfo *TRI; // 目标 平台 寄存 器 信息 
MachineFunction &MF; // 机 器 码 函 数 
MachineRegisterInfo &MRI; // 虚拟 /真实 寄存 器 映射 
std::vector«SUnit» SUnits; // 调度 单元 
SUnit EntrySU; // 区 域 进入 的 特定 节点 
SUnit ExitSU; // 区 域 退 出 的 特定 节点 
























































explicit ScheduleDAG(MachineFunction &mf); 
virtual -ScheduleDAG(); 
void clearDAG(); 


const MCInstrDesc *getInstrDesc(const SUnit *SU) const { 
if (SU->isInstr()) return &SU->getInstr()->getDesc(); 


return getNodeDesc(SU->getNode()); 
} 


virtual void dumpNode(const SUnit *SU) const = 0; 
private: 


const MCInstrDesc *getNodeDesc(const SDNode *Node) const; 


}; 


class SUnitIterator : public 
std::iterator«std::forward iterator tag, 
SUnit, ptrdiff t» ( 

3 


template <> struct GraphTraits«SUnit*» { 
typedef SUnit NodeType; 
typedef SUnitIterator ChildIteratorType; 
static inline NodeType *getEntryNode(SUnit *N) { 
return N; 
} 


static inline ChildIteratorType child_begin(NodeType *N) { 
return SUnitIterator::begin(N); 


j 


static inline ChildIteratorType child end(NodeType *N) ( 
return SUnitIterator::end(N); 
} 

}; 


template <> struct GraphTraits<ScheduleDAG*> : public 
GraphTraits<SUnit*> { 
ra S 


// 对 DAG 的 拓扑 排序 ， 把 DAG 转 成 线性 的 指令 集合 
Class ScheduleDAGTopologicalSort { 
std: :vector<SUnit> &SUnits; 
SUnit *ExitSU; 
std::vector«int» Index2Node; 
std::vector«int» Node2Index; 
BitVector Visited; 
// 为 了 进行 拓扑 排序 ， 对 DAG 进 行 DFS 
void DFS(const SUnit *SU, int UpperBound, bool& HasLoop); 
void Shift(BitVector& Visited, int LowerBound, int UpperBound); 





void Allocate(int n, int index); 


public: 


ScheduleDAGTopologicalSort(std::vector<SUnit> &SUnits, SUnit *E 
void InitDAGTopologicalSorting(); 

bool IsReachable(const SUnit *SU, const SUnit *TargetSU); 

bool WillCreateCycle(SUnit *SU, SUnit *TargetSU); 

void AddPred(SUnit *Y, SUnit *X); 

void RemovePred(SUnit *M, SUnit *N); 

typedef std::vector<int>::iterator iterator; 

typedef std::vector<int>::const_iterator const_iterator; 
iterator begin() { return Index2Node.begin(); } 

const_iterator begin() const { return Index2Node.begin(); } 


iterator end() { return Index2Node.end();}} 
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调度 算法 实现 了 SelectionDAG 关 中 的 指令 调度 ， 包 括 拓扑 排序 、 深 
度 优先 搜索 、 操 作 函 数 、 移 动 节点 、 指 令 列表 迭代 等 算法 。 它 会 考 感 各 
种 启发 式 算法 ， 包 括 寄 存 器 压力 、 溢 出 开销 、 生 存 周期 分 析 等 ， 来 确定 
最 可 能 的 指令 调度 顺序 。 
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e 关于 指令 调用 的 详细 实现 ， 请 参见 lib/CodeGen/SelectionDAG 目 录 
的 Sche-duleDAGSDNodes.cpp、ScheduleDAGSDNodes.h、Schedule 
DAGRR-List.cpp、 ScheduleDAGFast.cpp、Sche dule DAGVLIW.cpp 
文件 。 





[1 寄存 器 溢出 : 寄存 器 洲 出 和 栈 洲 出 (stack overflow) 不 是 同一 个 
概念 。 在 基于 寄存 占 的 执行 模型 中 ， 寄 存 器 洲 出 是 由 于 机 器 的 寄存 占 数 
量 限 制 ， 导 致 部 分 变量 无 法 分 配 于 寄存 占 ， 因 此 需要 将 之 溢出 到 主 存 
中 ， 在 使 用 之 前 加 载 到 寄存 器 中 ， 之 后 再 存 回 主 存 。 一 一 译 者 注 


[2] 把 代码 发 射 到 内 存 : 传统 的 代码 编译 会 得 到 一 个 可 执行 文件 ， 在 
程序 执行 时 这 个 文件 中 的 代码 和 数据 会 加 载 到 内 存 ， 然 后 执行 。 而 JIT 
则 跳 过 了 可 执行 文件 ， 直 接 把 代码 放 到 内 存 中 指定 的 位 置 来 执行 ， 以 达 
到 动态 执行 的 效果 。 一 一 译 者 注 











第 7 章 laste lc 


本 章 涵 凋 以 下 话题 : 


。 消除 机 器 码 的 公共 子 表 达 式 
。 活动 周期 分 析 

。 寄存 器 分 配 

e. 插入 头 尾 代码 

e 代码 发 射 

。 尾 调用 优化 

。 兄弟 调用 优化 


概述 


目前 生成 的 机 器 码 还 没有 映射 到 真实 的 目标 架构 的 寄存 右 ， 因 为 现 
在 的 寄存 器 还 仅仅 是 虚拟 寄存 器， 它 的 数量 无 限 ， 所 以 说 生成 的 机 需 码 
古 SSA 形 式 的 。 但 是 ， 目 标 平 人 台 的 寄存 器 是 数量 有 限 的 ， 因 此 ， 还 需要 
寄存 器 分 配 算法 进行 许多 局 发 式 计算 ， 来 以 一 种 最 佳 的 方式 把 无 限 的 寄 
存 器 集合 映射 到 有 限 的 物理 寄存 器 集合 上 。 


不 过 在 寄存 器 分 配 之 前 ， 代 码 还 有 优化 的 机 会 ， 而 SSA 形 式 的 机 器 
码 能 够 轻松 地 应 用 许多 优化 算法 。 对 于 一 些 优化 技术 的 算法 ， 如 机 器 码 
无 用 代码 消除 和 机 器 码 公 共 子 表达 式 消除 ， 儿 乎 和 LLVM IR 的 一 样 。 但 
不 同 的 是 ， 对 机 器 码 的 优化 有 另外 的 约束 检查 。 


本 章 会 展示 一 个 LLVM 人 代码 库 已 经 实现 的 机 器 码 优化 技术 一 一 机 器 
f4CSE (Common Subexpression Elimination 一 一 公共 子 表达 式 消 除 ) 
一 一 来 让 你 了 解 机 器 码 优 化 算法 如 何 实现 。 
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CSE 算 法 的 目的 是 消除 公共 子 表达 式 的 计算 ， 删 除 元 余 代 码 以 减 
少 计算 时 间 ， 并 使 得 代码 更 加 紧凑 。 让 我 们 看 看 LLVM 代 码 库 的 代码 来 
弄 明白 它 是 如 何 实现 的 ， 详 细 代 码 位 于 lib/CodeGen/MachineCSE.cpp 文 
件 。 


详细 步 又 


1. MachineCSE 类 作用 于 机 器 码 函 数 ， 所 以 它 继 承 了 
MachineFunctionPass 类 。 它 有 多 个 成 员 ， 例 如 TargetInstructionInfo 用 于 
获取 目标 平台 指令 信息 〈 用 于 执行 CSE) ; TargetRegisterInfo 用 于 获取 
目标 平台 寄存 器 信息 a (例如 它 是 否 属于 保留 寄存 器 类 ， 或 者 类 似 的 
28) ，MachineDominatorTree 用 于 获取 机 器 码 区 块 支配 者 树 的 信息 。 





Class MachineCSE : public MachineFunctionPass { 
const TargetInstrInfo *TII; 
const TargetRegisterInfo *TRI; 
AliasAnalysis *AA; 
MachineDominatorTree *DT; 
MachineRegisterInfo *MRI; 


类 的 构造 函数 初始 化 Pass， 和 定义 如 下 : 


public: 
static char ID; // Pass ID 
MachineCSE() : MachineFunctionPass(ID), 
LookAheadLimit(5), CurrVN(0) { 
initializeMachineCSEPass(*PassRegistry::getPassRegistry()); 
} 


3. getAnalysisUsage() A 数 确定 了 在 此 Pass 运 行 之 前 运行 的 Pass， 通 
过 这 些 Pass 可 以 获得 一 些 当 前 Pass 需 要 的 统计 数据 : 


void getAnalysisUsage(AnalysisUsage &AU) const override { 
AU.setPreservesCFG(); 
MachineFunctionPass::getAnalysisUsage(AU); 
AU.addRequired<AliasAnalysis>(); 
AU.addPreservedID(MachineLoopInfolID) ; 
AU.addRequired<MachineDominatorTree>(); 
AU.addPreserved<MachineDominatorTree>(); 


4. ”在 Pass 中 声明 一 些 辅助 函数 ， 来 检查 简单 的 复写 传播 、 无 用 定 
义 、 物 理 寄存 器 生存 状态 ， 及 其 定义 使 用 : 


private: 


bool PerformTrivialCopyPropagation(MachineInstr *MI, 
MachineBasicBlock *MBB); 


bool isPhysDefTriviallyDead(unsigned Reg, 
MachineBasicBlock::const_iterator I, 
MachineBasicBlock::const iterator E) const; 


bool hasLivePhysRegDefUses(const MachineInstr *MI, 
const MachineBasicBlock *MBB, 

SmallSet«unsigned,8» &PhysRefs, 
SmallVectorImpl«unsigned» &PhysDefs, 

bool &PhysUseDef) const; 


bool PhysRegDefsReach(MachineInstr *CSMI, MachineInstr *MI, 
SmallSet«unsigned,8» &PhysRefs, 
SmallVectorImpl<unsigned> &PhysDefs, 
bool &NonLocal) const; 


5. 还 有 一 些 辅助 函数 ， 用 于 确定 对 表达 式 执行 CSE 的 合法 性 和 收益 


bool isCSECandidate(MachineInstr *MI); 
bool isProfitableToCSE(unsigned CSReg, unsigned Reg, 
MachineInstr *CSMI, MachineInstr *MI); 


Actual CSE performing function 
bool PerformCSE(MachineDomTreeNode *Node); 


我 们 来 看 看 CSE 函 数 是 如 何 实现 的 : 
1. Passe 1T Z Jui Bi 76 Wi] HjrunOnMachineFunction( PK Zi : 
bool MachineCSE::runOnMachineFunction(MachineFunction &MF){ 


if (skipOptnoneFunction(*MF.getFunction())) 
return false; 


TII - MF.getSubtarget().getInstrInfo(); 
TRI - MF.getSubtarget().getRegisterInfo(); 
MRI = &MF.getRegInfo(); 


AA = &getAnalysis<AliasAnalysis>(); 
DT = &getAnalysis<MachineDominatorTree>(); 
return PerformCSE(DT->getRootNode()); 


2， 然 后 调用 PerformCSE0O 函 数 ， 它 以 DomTree 的 根 节 点 为 起 点 ， 对 
DomTree 执 行 DFS 遍 历 ， 以 DomTree 的 节点 构建 工作 列表 。 完 成 对 
DomTree 的 DFS 通 历 之 后 ， 处 理 与 工作 列表 中 每 个 节点 相对 应 的 
MachineBasicBlock 类 : 





bool MachineCSE: :PerformCSE(MachineDomTreeNode *Node) { 
SmallVector«MachineDomTreeNode*, 32> Scopes; 
SmallVector«MachineDomTreeNode*, 8» WorkList; 
DenseMap<MachineDomTreeNode*, unsigned» OpenChildren; 


CurrVN = 0; 
// DES 构建 worklist 
WorkList.push back(Node); 
do ( 
Node - WorkList.pop back val(); 
Scopes.push back(Node); 
const std::vector<MachineDomTreeNode*> &Children = 
Node-»getChildren(); 
unsigned NumChildren - Children.size(); 
OpenChildren[Node] = NumChildren; 
for (unsigned i = 0; i != NumChildren; ++i) { 
MachineDomTreeNode *Child = Children[i]; 
WorkList.push back(Child); 





j 
} while (!WorkList.empty()); 


/ /' AMAT CSE 


bool Changed = false; 
for (unsigned i = 0, e = Scopes.size(); i != e; ++1) { 
MachineDomTreeNode *Node = Scopes[i]; 
MachineBasicBlock *MBB = Node-»getBlock(); 
EnterScope(MBB); 
Changed |= ProcessBlock(MBB); 
ExitScopelfDone(Node, OpenChildren); 


j 


return Changed; 


j 


3. ”下 一 个 重要 的 函数 是 ProcessBlock() 函 数 ， 作 用 于 机 器 人 码 的 基本 
块 。 它 裔 历 MachineBasicBlock 类 的 指令 并 检查 CSE 的 合法 性 和 收益 性 ， 
确定 是 否 执 行 CSE: 


bool MachineCSE: :ProcessBlock(MachineBasicBlock *MBB) { 
bool Changed = false; 


SmallVector<std: :pair<unsigned, unsigned>, 8> CSEPairs; 
SmallVector<unsigned, 2> ImplicitDefsToUpdate; 





// 遍 历 每 一 个 MachineBasicBlcok 中 的 机 器 码 指令 

for (MachineBasicBlock::iterator I = MBB->begin(), E = 
MBB->end(); I != E; ) { 

MachineInstr *MI = &*I; 

++I) 
// 检查 是 否 适合 进行 CSE 

if (!isCSECandidate(MI)) 

continue; 








bool FoundCSE - VNT.count(MI); 
if (!FoundCSE) { 
// 尝试 不 重要 的 复写 传播 来 寻找 更 多 的 CSE 机 会 
if (PerformTrivialCopyPropagation(MI, MBB)) { 
Changed = true; 


// ERMI E, CRJE NRI 
if (MI->isCopyLike()) 
continue; 

















// 再 次 洽 试 CSE 
FoundCSE = VNT.count(MI); 


bool Commuted = false; 
if (!FoundCSE && MI->isCommutable()) { 
MachineInstr *NewMI = TII->commuteInstruction(MI); 
if (NewMI) { 
Commuted = true; 
FoundCSE = VNT.count(NewMI); 
if (NewMI != MI) { 
// 新 的 指令 ， 不 需要 保存 
NewMI ->eraseFromParent(); 
Changed = true; 
} else if (!FoundCSE) 
// MI 改变 了 ， 但 需要 重新 计算 


(void)TII->commuteInstruction(MI); 






































} 
} 
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// 如 果 指 令 使 用 了 物理 寄存 器 ， 那 么 也 是 不 安全 的 。 
bool CrossMBBPhysDef = false; 
SmallSet<unsigned, 8> PhysRefs; 
SmallVector<unsigned, 2> PhysDefs; 

bool PhysUseDef = false; 


// ”检查 这 条 指令 是 否 有 CSE 的 标记 。 检 查 它 是 否 使 用 了 物理 寄存 器 ， 如 果 是 就 取消 CSE 
标记 
if (FoundCSE && hasLivePhysRegDefUses(MI, MBB, PhysRefs, 
PhysDefs, 





























PhysUseDef)) { 
FoundCSE = false; 


j 


if (!FoundCSE) { 
VNT.insert(MI, CurrVN++); 
Exps.push. back(MI); 
continue; 


j 


// 判断 是 否 存 在 公共 子 表达 式 ， 完 成 决定 的 工作 。 
// 找到 一 个 公共 子 表达 式 ， 消 除 它 。 

unsigned CSVN = VNT.lookup(MI); 

MachineInstr *CSMI = Exps[CSVN]; 

DEBUG(dbgs() << "Examining: " << *MI); 

DEBUG(dbgs() << "*** Found a common subexpression: " << 
*CSMI); 














// 检查 这 个 CSE 的 收益 性 

bool DoCSE = true; 

unsigned NumDefs = MI->getDesc().getNumDefs() + 
MI->getDesc().getNumImplicitDefs(); 


for (unsigned i = 0, e = MI->getNumOperands(); NumDefs 
&& i !- e; ++i) { 
MachineOperand &MO = MI->getOperand(i); 
if (!MO.isReg() || !MO.isDef()) 
continue; 
unsigned OldReg - MO.getReg(); 
unsigned NewReg = CSMI->getOperand(i).getReg(); 


// 如 果 MI 中 的 定义 有 用 ， 为 了 保证 它 在 CSMI 中 也 有 有用， 遍历 隐 式 CSMI 和 MI 的 定 























if (MO.isImplicit() && !MO.isDead() && CSMI-»getOperand(i). 
isDead()) 
ImplicitDefsToUpdate.push back(i); 
if (OldReg == NewReg) { 
--NumDefs; 
continue; 


j 


assert(TargetRegisterInfo::isVirtualRegister(OldReg) 
&& 
TargetRegisterInfo::isVirtualRegister(NewReg) 


&& 
"Do not CSE physical register defs!"); 


if (!isProfitableToCSE(NewReg, OldReg, CSMI, MI)) ( 
DEBUG(dbgs() «« "*** Not profitable, avoid 
CSE!\n"); 
DoCSE = false; 
break; 


j 


// 如 果 旧 的 指令 不 能 存在 于 新 的 指令 的 寄存 器 类 中 ， 不 执行 CSE 
const TargetRegisterClass *OldRC = MRI->getRegClass(OldReg); 
if (!MRI->constrainRegClass(NewReg, OldRC)) { 
DEBUG(dbgs() << "*** Not the same register class, 
avoid CSE!\n"); 
DoCSE = false; 
break; 


} 
CSEPairs.push back(std::make pair(OldReg, NewReg)); 
--NumDefs; 


j 


// 实际 执行 消除 
if (DoCSE) { 
for (unsigned i = 0, e = CSEPairs.size(); i !- e; 
++i) { 
MRI->replaceRegwith(CSEPairs[i].first, CSEPairs[i]. 
second); 
MRI->clearKillFlags(CSEPairs[i].second); 
} 





// 如 果 MI 中 的 定义 有 用 ， 为 了 保证 它 在 CSMI 中 也 有 用 ， 遍 历 隐 式 CSMI 和 MI 的 定 




















义 
for (unsigned i = 0, e = ImplicitDefsToUpdate.size(); 
i != e; ++i) 
CSMI->getOperand(ImplicitDefsToUpdate[i]). 
setIsDead(false); 


if (CrossMBBPhysDef) { 
// 向 MBB Livein 表 增加 物理 寄存 器 定义 
while (!PhysDefs.empty()) { 
unsigned LiveIn - PhysDefs.pop back val(); 
if (!MBB-»isLiveIn(LiveIn)) 
MBB-»addLiveIn(LiveIn); 


























j 


++NumCrossBBCSEs; 
} 
MI->eraseFromParent(); 
++NumCSEs; 
if (!PhysRefs.empty()) 
++NumPhysCSEs; 
if (Commuted) 
++NumCommutes; 
Changed = true; 
) else { 
VNT.insert(MI, CurrVN++); 
Exps.push. back(MI); 


CSEPairs.clear(); 
ImplicitDefsToUpdate.clear(); 


j 


return Changed; 


) 
4. 我 们 来 仔细 看 一 下 判断 合法 性 和 收益 性 以 决定 CSE 的 函数 : 


Re *MI) ( 
总 式 定 义 ， 不 进行 CSE 





bool MachineCSE: 
// 如 果 机 器 指令 是 PHI， 或 者 内 联 汇编 ， 或 者 隐 














if (MI->isPosition() || MI->isPHI() || MI- 


>isImplicitDef() || MI-»isKill() 
MI->isInlineAsm() || MI->isDebugValue() ) 


return false; 
// 忽略 复制 


if (MI->isCopyLike()) 
return false; 





// 忽略 我 们 显然 不 能 移动 的 指令 
if (MI->mayStore() || MI->isCall() 
|| MI->hasUnmodeledSideEffects() ) 
return false; 


|| MI->isTerminator() 

















if (MI->mayLoad()) { 
"T m 好 的 ， 这 个 指令 执行 了 一 次 加 载 。 为 了 更 精确 一 点 ， 我 们 让 目标 平台 决定 这 个 
ABC JIT BEP 

// 值 是 否 为 一 个 常量 。 如 果 是 ， 我 们 就 将 它 作 为 一 次 加 载 使 用 。 

if (!MI->isInvariantLoad(AA) ) 


return false; 














j 


return true; 


j 
5. 收益 性 函数 代码 如 下 : 


bool MachineCSE: :isProfitableToCSE(unsigned CSReg, unsigned 


Reg, 
MachineInstr *CSMI, MachineInstr *MI) { 


= // 如 果 CSReg 被 所 有 的 寄存 器 使 用 ， 不 应 该 执行 CSE， 和 否则 会 
Hk 


bool MayIncreasePressure - true; 
if (TargetRegisterInfo::isVirtualRegister(CSReg) && 


TargetRegisterInfo::isVirtualRegister(Reg)) ( 


MayIncreasePressure - false; 


SmallPtrSet«MachineInstr*, 8» CSUses; 
for (MachineInstr &MI : MRI- 


»use nodbg instructions(CSReg)) { 
CSUses.insert(&MI); 





兽 加 CSReg 的 寄存 器 





} 
for (MachineInstr &MI : MRI- 
>use_nodbg_instructions(Reg)) 


if (!CSUses.count(&MI)) { 
MayIncreasePressure - true; 
break; 
} 
} 


if (!MayIncreasePressure) return true; 


// 启发 规则 #1: 如果 定义 不 在 本 地 ， 也 不 在 紧邻 的 前 驱 ， 并 且 计算 量 很 小 ， 那 么 
不 进行 CSE。 
// 否则 会 增加 寄存 器 压力 ， 甚 至 导致 其 他 计算 的 溢出 。 
if (TII->isAsCheapAsAMove(MI)) { 
MachineBasicBlock *CSBB = CSMI-»getParent(); 
MachineBasicBlock *BB = MI-»getParent(); 
if (CSBB != BB && !CSBB->isSuccessor (BB) ) 
return false; 
} 


// 启发 规则 #2: 如 果 表 达 式 不 使 用 虚拟 寄存 器 ， 并 且 唯 一 的 见 余 计算 是 复制 ， 不 进 
行 CSE。 
bool HasVRegUse 
for (unsigned i 
++i) { 
const MachineOperand &MO = MI-»getOperand(i); 
if (MO.isReg() && MO.isUse() && 
TargetRegisterInfo::isVirtualRegister(MO.getReg())) 























false; 
0, e = MI->getNumOperands(); i !- e; 


HasVRegUse - true; 
break; 


j 


} 
if (!HasVRegUse) { 
bool HasNonCopyUse = false; 
for (MachineInstr &MI : MRI- 
>use_nodbg_instructions(Reg)) { 
// 忽略 复制 
if (!MI.isCopyLike()) ( 
HasNonCopyUse - true; 
break; 





j 


if (!HasNonCopyUse) 
return false; 
} 


A 启发 规则 #3: ”如 果 公 共 子 表达 式 被 PHI 使 用 ， 那 么 除非 该 定义 在 新 使 用 的 BB 中 








/ 否则 不 再 使 用 它 

bool HasPHI = false; 

SmallPtrSet«MachineBasicBlock*, 4» CSBBs; 

for (Machinelnstr &MI : MRI- 

»use nodbg instructions(CSReg)) { 

HasPHI |= MI.isPHI(); 
CSBBs.insert(MI.getParent()); 

} 


if (!HasPHI) 
return true; 
return CSBBs.count(MI->getParent()); 


J 


LEER 


MachineCSEPass 作 用 于 机 器 人 码 函 数 。 它 获取 DomTree 的 信息 ， 会 以 
深度 优先 搜索 的 方式 遍历 DomTree， 以 MachineBasicBlock 为 节点 创建 工 
作 列 表 ; 然后 对 其 中 的 每 一 个 区 块 进行 CSE。 在 每 一 个 区 块 中 ， 它 裔 历 
所 有 的 指令 ， 检 查 是 否 能 够 进行 CSE。 人 然后 会 检查 消除 见 余 表达 式 的 收 
益 性 。 一 日 旦 证 明 进行 CSE 消 除 具 有 收益 性 ， 它 会 把 对 应 的 
MachineInstruction 类 从 MachineBasicBlock 类 消除 ， 同 时 也 会 进行 一 个 简 
an 机 器 指令 的 复写 传播 。 有 些 时 候 ，MachineInstruction 可 能 没 办 法 在 

步骤 进行 CSE， 但 在 一 次 复写 传播 之 后 就 能 够 进行 CSE 了 。 


HZ pu] 


关 丁 SSA 形式 的 机 器 但 优 化 ， 例如 机 器 码 无 用 代码 消除 Pass 的 实 
现 ， 请 参见 lib/CodeGen/DeadMachineInstructionElim.cpp 文 件 。 








活动 周期 分 析 


本 节 介 绍 寄存 器 分 配 。 在 此 之 前 ， 你 必须 了 解 什么 是 活动 变量 和 活 
动 周 期 。 活 动 周 期 ， 指 的 是 一 个 变量 的 活动 范围 ， 即 变量 的 第 一 次 定义 
到 最 后 一 次 使 用 的 范围 。 为 此 ， 我 们 需要 计算 一 条 指令 之 后 不 再 使 用 的 
寄存 器 集合 ， 即 变量 的 最 后 一 次 使 用 ， 以 及 一 条 指令 使 用 但 接 下 来 的 指 
令 不 使 用 的 寄存 器 集合 。 我 们 计算 函数 中 每 个 虚拟 寄存 器 和 每 个 物理 寄 
存 器 的 活动 变量 信息 。SSA 能 够 大 致 计算 虚拟 寄存 器 的 活动 信息 ， 我 们 
只 需 记 录 区 块 中 物理 寄存 器 的 信息 。 在 寄存 器 分 配 之 前 ，LLVM 假 定 物 
理 寄 存 器 只 存在 于 一 个 单一 的 基本 块 之 内 ， 这 种 假定 使 得 只 需要 对 每 一 
个 基本 块 进行 一 次 局 部 分 析 就 能 计算 物理 寄存 器 的 生命 周期 。 在 执行 活 
动 变量 分 析 之 后 ， 我 们 便 有 了 执行 活动 周期 分 析 和 构建 活动 周期 所 必需 
的 信息 。 为 此 我 们 首先 为 基本 块 和 机 器 指令 标号 ， 在 处 理 共 享 寄存 器 的 
变量 之 后 ， 通 常会 处 理 寄存 器 中 的 参数 。 虚 拟 寄 存 器 的 活动 周期 按照 机 
器 指令 的 顺序 计算 (1,N)。 活 动 周期 Gi,j) 指 的 是 一 个 变量 的 活动 范围 ， 并 
Al <=i<=j<N. 


本 节 通 过 一 个 样 例 程序 来 展示 如 何 列 举 程 序 中 的 活动 周期 ， 以 及 
LLVM 如 何 来 计算 这 些 活动 周期 。 


准备 工作 
开始 之 前 ， 我 们 需要 一 段 用 于 活动 周期 分 析 的 测试 代码 ， 为 了 简单 


起 见 ， 我 们 使 用 C 语 言 代 码 ， 然 后 转 为 LLVM IR. 
1. 首先 编写 一 段 包含 if-else 区 块 的 测试 程序 : 














$ cat interval.c 
void donothing(int a) { 
return; 


int func(int i) { 
int a = 5; 


donothing(a); 

int m = a; 

donothing(m); 

a = 9; 

if (i < 5) { 
int b = 3; 
donothing(b); 
int z - b; 
donothing(z); 


else { 
int k = a; 
donothing(k); 


return m; 


2. 使 用 Clang 把 C 语 言 代 码 转 为 IR， 用 cat 命 令 查 看 生成 的 IR: 


$ clang -cc1 -emit-llvm interval.c 


$ cat interval.1l 


; ModuleID - 'interval.c' 
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128" 
target triple = "x86 64-unknown-linux-gnu" 


; Function Attrs: nounwind 

define void Qdonothing(i32 %a) #0 { 
%1 = alloca i32, align 4 
store 132 %a, 132* %1, align 4 
ret void 


} 


; Function Attrs: nounwind 

define i32 @func(i32 %i) #0 ( 
%1 = alloca i32, align 
%a = alloca 132, align 
%m alloca i32, align 
%b alloca i32, align 
%Z alloca i32, align 
%k alloca i32, align 
store i32 %i, i32* %1, align 4 
store i32 5, i32* %a, align 4 
%2 = load i32, i32* %a, align 4 
call void Qdonothing(i32 %2) 


BRARRAA 


} 


attributes #0 = 


%3 = load 
store i32 
%4 = load 
call void 
store i32 
%5 = load 
%6 = icmp 
br i1 %6, 


«label»:7 
store i32 
%8 = load 
call void 
%9 = load 
store i32 
%10 = 
call void 


132, 132* %a, align 4 
%3, 132* %m, align 4 
132, 132* %m, align 4 
@donothing(i32 %4) 

9, 132* %a, align 4 
132, 132* %1, align 4 
slt i32 %5, 5 

label %7, label %11 


; preds = %0 
3, 132* %b, align 4 
132, 132* %b, align 4 
@donothing(i32 %8) 
132, 132* %b, align 4 
%9, 132* %z, align 4 


load i32, 132* %z, align 4 


@donothing(i32 %10) 


br label %14 


<label>:11 


%12 = 


; preds = %0 


load i32, i32* %a, align 4 


store i32 %12, 132* %k, align 4 
%13 = load 132, i32* %k, align 4 
call void @donothing(i32 %13) 


br label %14 


<label>:14 


%15 = 


; preds = %11, %7 


load i132, i32* %m, align 4 


ret i32 %15 


{ nounwind "less-precise-fpmad"="false" 


"no-frame-pointer-elim"="false" "no-infs-fp-math"="false" 
"no-nans-fp-math"="false" "no-realign-stack" "stack- 
protector-buffer-size"="8" "unsafe-fp-math"="false" "use- 
soft-float"="false" } 

!llvm.ident = !{!0} 


10 = 


详细 步 又 


!'{! "clang version 3.7.0 (trunk 234045)"} 


1. 为 了 列 出 活动 周期 ， 我 们 需要 为 LiveIntervalAnalysis.cpp 文 件 增加 
一 段 代码 来 输出 活动 周期 。 我 们 增加 以 下 内 容 《〈 增 加 的 代码 用 + 号 标 
ido 


void LiveIntervals::computeVirtRegInterval(LiveInterval 
&LI) ( 

assert(LRCalc && "LRCalc not initialized."); 

assert(LI.empty() && "Should only compute empty 
intervals."); 

LRCalc-»reset(MF, getSlotIndexes(), DomTree, 
&getVNInfoAllocator()); 
LRCalc->calculate(LI, MRI->shouldTrackSubRegLiveness(LI.reg)); 
computeDeadValues(LI, nullptr); 


/**** 增加 以 下 代码 ****/ 
十 llvm::outs() << WKKKKKKKKKK INTERVALS MERERI NS 





// 输出 regunits 


+ for (unsigned i = 0, e = RegUnitRanges.size(); i !- e; 
T) 
* if (LiveRange *LR - RegUnitRanges[i]) 
+ llvm::outs() << PrintRegUnit(i, TRI) << ' ' << *LR 
<< '\n'; 





// 输出 虚拟 寄存 器 
+ llvm::outs() << "virtregs:"; 
+ for (unsigned i = 0, e = MRI->getNumVirtRegs(); 1 != e; 
++i) { 
+ unsigned Reg = TargetRegisterInfo::index2VirtReg(i); 
+ if (hasInterval(Reg) ) 
+ llvm::outs() << getInterval(Reg) << '\n'; 


Tg 
2. 在 修改 之 前 的 源码 文件 之 后 重新 构建 LLVM， 并 在 路 径 下 安装 。 
3. 使 用 lc 命令 编译 IR 格 式 的 测试 代码 ， 会 得 到 以 下 的 活动 周期 : 





$ llc interval.11 

淡淡 淡淡 淡淡 淡淡 火炎 INTERVALS kkkkkkkkkk 
virtregs:%vregO [16r,32r:0) 0@16r 
淡淡 淡淡 淡淡 淡淡 火炎 INTERVALS *ckckck k ke kkekek 
virtregs:%vregO [16r,32r:0) 0@16r 
kkkkkkkkkk INTERVALS kkkkkkkkkk 
virtregs:%vregO [16r,32r:0) 0@16r 


%vreg1 [80r,96r:0) 0080r 
kkkkkkkkkk INTERVALS kkkkkkkkkk 
Virtregs:%vreg0 [16r,32r:0) 0@16r 
%vreg1 [80r,96r:0) 0080r 

%vreg2 [144r,192r:0) 0@144r 

淡淡 淡淡 淡淡 淡淡 火炎 INTERVALS *ckckck ke ke kk kk 
virtregs:%vregO [16r,32r:0) 0@16r 
%vreg1 [80r,96r:0) 0080r 

%vreg2 [144r,192r:0) 0@144r 

%vreg5 [544r,592r:0) 0@544r 

淡淡 淡淡 淡淡 淡淡 火炎 INTERVALS kkkkkkkkkk 
virtregs:%vregO [16r,32r:0) 0@16r 
%vreg1 [80r,96r:0) 0080r 

%vreg2 [144r,192r:0) 0@144r 

%vreg5 [544r,592r:0) 0@544r 

%vreg6 [352r,368r:0) 0@352r 

淡淡 淡淡 淡淡 淡淡 火炎 INTERVALS kkkkkkkkkk 
virtregs:%vregO [16r,32r:0) 0@16r 
%vreg1 [80r,96r:0) 0080r 

%vreg2 [144r,192r:0) 0@144r 

%vreg5 [544r,592r:0) 0@544r 

%vreg6 [352r,368r:0) 0@352r 

%vreg7 [416r,464r:0) 0@416r 

*kkokc kc k kA kk INTERVALS kkkkkkkkkk 
Virtregs:%vreg0 [16r,32r:0) 0@16r 
%vreg1 [80r,96r:0) 0080r 

%vreg2 [144r,192r:0) 0@144r 

%vreg5 [544r,592r:0) 0@544r 

%vreg6 [352r,368r:0) 0@352r 

%vreg7 [416r,464r:0) 0@416r 

%vreg8 [656r,672r:0) O0@656r 


CER 


前 面 的 例子 中 展示 了 活动 周期 是 如 何 与 每 一 个 虚拟 寄存 器 关联 起 来 
的 。 活 动 周期 的 开始 和 结束 用 括 写 标记 。 活 动 周 期 的 计算 是 从 
LiveVariables::runOnMachineFunction (MachineFunction &mf) 函 数 开 始 ， 
它 位 于 lib/Code Gen/LiveVariables.cpp 文 件 ， 它 通过 HandleVirtrRegUse 和 
HandleVirtrRegDef 消 数 来 计算 寄存 器 的 定义 和 使 用 ， 之 后 通过 getVarInfo 
函数 得 到 给 定 虚 拟 寄存 器 的 VarInfo 对 象 。 


LiveInterval 和 LiveRange 类 定义 于 LiveInterval.cpp 中 。 通 过 它们 可 以 














获得 变量 活动 周期 的 信息 ， 以 便 检查 活动 周期 是 否 重 登 。 


在 LiveIntervalAnalysis.cpp 文 件 中 ， 实 现 了 活动 周期 分 析 的 Pass， 它 
以 DFS 的 顺序 扫描 基本 块 ( 以 线性 方式 组 织 ) ， 为 每 个 虚拟 寄存 器 和 物 
理 寄存 器 创建 活动 周期 。 之 后 这 些 分 析 会 被 寄存 器 分 配 占 使 用 ， 第 8 章 


的 章节 会 讨论 这 个 问题 - 
Æ N 
EH p 


。 如 末 你 想 知 道 不 同 基本 块 的 虚拟 寄存 器 是 如 何 产 生 的 ， 或 者 想 看 看 
这 些 虚 拟 寄存 器 的 生命 周期 ， 你 可 aie -debug-only=regallocfit + 
行 参数 运行 lc 工具 来 编译 测试 实例 。 当 然 ， 你 需要 debug 版 本 的 
LLVM. 


> 关于 活动 周期 的 更 多 信息 4 9 请 参 参见 以 下 这 文 些 代 码 文件 。 





o lib/CodeGen/LiveInterval.cpp 
o lib/CodeGen/LiveIntervalAnalysis.cpp 
o lib/CodeGen/LiveVariables.cpp. 
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寄存 器 分 配 的 任务 是 把 物理 寄存 器 分 配给 虚拟 寄存 器 。 虚 拟 寄 存 器 
是 无 限 的 ， 而 一 台 机 器 的 物理 寄存 器 是 有 限 的 。 因 此 ， 寄 存 器 分 配 旨 在 
最 大 化 分 配给 虚拟 寄存 器 的 物理 寄存 器 数量 。 


本 节 介 绍 在 LLVM 中 寄存 器 如 何 表 示 ， 更 改 寄 存 嚣 信息 的 详细 步 
又 ， 以 及 内 建 的 寄存 器 分 配器 。 


准备 工作 
你 需要 构建 并 安装 LLVM。 
Va WR 


1. build-folder/lib/Target/X86/X86GenRegisterInfo.inc X fF [f] Hi) J L4T € 
示 了 在 LLVM 中 寄存 器 如 何 表示 ， 可 以 看 到 ， 寄 存 器 用 整数 来 表示 : 


namespace X86 { 
enum { 
NoRegister, 





2. 对 于 具有 共享 相同 物理 位 置 的 寄存 器 的 架构 来 说 ， 可 以 查看 这 个 


架构 的 RegisterInfo.td 文 件 来 了 解 这 些 别名 信息 。 让 我 们 来 检查 
lib/Target/X86/X86RegisterInfo.td 文 件 。 下 面 的 代码 片段 展示 了 EAX、 
AX、AL 让 寄存 器 其 实 是 互 为 别名 (共享 ) 的 (我 们 只 提 及 了 最 小 的 寄 
存 器 别名 ) : 


def AL : X86Reg<"al", 0»; 
def DL : X86Reg<"d1", 2>; 
def CL : X86Reg<"cl", 1»; 
def BL : X86Reg«"bl", 3»; 


def AH : X86Reg<"ah", 4»; 
def DH : X86Reg<"dh", 6»; 
def CH : X86Reg<"ch", 5»; 
def BH : X86Reg<"bh", 7>; 


def AX : X86Reg\<"ax", 0, \[AL,AH]>; 
def DX : X86Reg\<"dx", 2, N[DL, DH]»; 
def CX : X86Reg\<"cx", 1, N[CL, CH]»; 
def BX : X86Reg\<"bx", 3, \[BL,BH]>; 


// 32 位 寄存 器 
let UDRE OLN Ces = [sub_16bit] in { 


def EAX : X86Reg<"eax", ©, [AX]>, DwarfRegNum<[-2, ©, 0]»; 
def EDX : X86Reg<"edx", 2, [DX]>, DwarfRegNum<[-2, 2, 2]>; 
def ECX : X86Reg<"ecx", 1, [CX]>, DwarfRegNum<[-2, 1, 1]>; 
def EBX : X86Reg<"ebx", 3, [BX]>, DwarfRegNum<[-2, 3, 3]>; 
def ESI : X86Reg<"esi", 6, [SI]>, DwarfRegNum<[-2, 6, 6]>; 
def EDI : X86Reg<"edi", 7, [DI]>, DwarfRegNum<[-2, 7, 7]>; 
def EBP : X86Reg<"ebp", 5, [BP]>, DwarfRegNum<[-2, 4, 5]>; 
def ESP : X86Reg<"esp", 4, [SP]>, DwarfRegNum<[-2, 5, 4]>; 

0, [IP]>, DwarfRegNum<[-2, 8, 8]>; 


def EIP : X86Reg<"eip", 


3， 为 了 改变 可 用 物理 寄存 器 的 数量 ， 可 以 在 TargetRegisterInfo.td 文 
件 中 把 一 些 寄 存 器 注释 掉 ， 这 是 RegisterClass 最 后 的 参数 。 打 开 
X86Register Info.cpp 文 件 把 AH、CH、DH 寄 存 器 删 掉 : 





def GR8 : RegisterClass<"X86", [18], 8, 
(add AL, CL, DL, AH, CH, DH, BL, 
BH, SIL, DIL, BPL, SPL, 
R8B, ROB, R10B, R11B, R14B, 
R15B, R12B, R13B)> { 


4. 在 构建 LLVM 的 时 候 ，.inc 文 件 会 首先 被 改变 ， 它 们 将 不 再 包含 
AH、CH、DH 和 寄存 器 。 


5. 在 “活动 周期 分 析 ” 一 节 中 我 们 执行 了 活动 周期 分 析 ， 现 在 我 们 使 
用 那 一 节 的 测试 代码 ， 运 行 LLVM 提 供 的 不 同 的 寄存 器 分 配 技术 
(fast. basic. greedy. pbqp) ， 在 这 里 我 们 运行 其 中 的 两 个 并 比较 其 
结果 : 





$ llc -regalloc=basic interval.ll -o intervalregbasic.s 


然后 创建 intervalregbasic.s 文 件 : 


$ cat intervalregbasic.s 

. text 

. file 

"interval.11" 

.globl donothing 

.align 16, 0x90 

.type donothing,Qfunction 
donothing: 4 Qdonothing 
4 BB#0: 

movl %edi, -4(%rsp) 

retq 
. Lfunc_endo: 

.Size donothing, .Lfunc_end0-donothing 


.globl func 

.align 16, 0x90 

.type func,Qfunction 
func: 4 @func 
# BB#0: 

subq $24, %rsp 

movl %edi, 20(%rsp) 

movl $5, 16(%rsp) 

movl $5, %edi 

callq donothing 

movl 16(%rsp), %edi 

movl %edi, 12(%rsp) 

callq donothing 

movl $9, 16(%rsp) 

cmpl $4, 20(%rsp) 

jg .LBB1 2 
4 BB#1: 


movl $3, 8(%rsp) 
movl $3, %edi 
callq donothing 
movl 8(%rsp), %edi 
movl %edi, 4(%rsp) 
jmp .LBB1 3 
.LBB1 2: 
movl 16(%rsp), %edi 
movl %edi, (%rsp) 
.LBB1 3: 
callq donothing 
movl 12(%rsp), %eax 
addq $24, %rsp 
retq 
.Lfunc end1: 
.Size func, .Lfunc endi-func 


运行 以 下 命令 ， 比 较 两 个 文件 : 
$ llc -regalloc-pbqp interval.11 -o intervalregpbqp.s 


得 到 intervalregbqp.s 文 件 : 


$cat intervalregpbqp.s 

.text 

.file “interval.11” 

.globl donothing 

.align 16, 0x90 

.type donothing, Qfunction 
donothing #@donothing 
# BB#0: 

movl %edik %eax 

movl %eax, -1(%rsp) 

retq 
. Lfunc_endo: 

.Size donothing, .Lfunc end0-donothing 


.globl func 

.align 16, 0x90 

.type func, @function 
Func: #@func 
# BB#0: 

subg $23, %rsp 

movl %edi, %eax 

movl %eax, 20(%rsp) 


movl %5, 16(%rsp) 
movl %5, %edi 
callq donothing 
movl 16(%rsp), %eax 
movl %eax, 12(%rsp) 
movl %eax, %edi 
callq donothing 
movl $9, 16(%rsp) 
cmpl $4, 20(%rsp) 
jg .LBB1 2 

# BB#1: 
movl $3, 8(%rsp) 
movl $3, %edi 
callq donothing 
movl 8(%rsp), %eax 
movl %eax, 4(%rsp) 
jmp.LBB1_3 

.LBB1 2: 
movl 16(%rsp), %eax 
movl %eax, (%rsp) 

.LBB1 3: 
movl %eax, %edi 
callq donothing 
movl 12(%rsp), %eax 
addq $24, %rsp 
retq 

.Lfunc end1: 
.Size func, .Lfunc end1-func 


6. 现在 ， 用 diff 工 具 并 排比 较 两 个 汇编 码 。 


Lem 


从 虚拟 寄存 器 到 物理 寄存 器 的 映射 有 两 种 方式 。 


。 直接 映射 : 使 用 TargetRegisterImnfo 和 MachineOperand 类 。 在 这 种 方 
式 下 ， 开 发 者 需要 提供 加 载 和 存储 指令 的 插入 位 置 ， 以 获得 和 存储 
内 存 中 的 值 。 

e 间接 映射 :使 用 VirtRegMap 类 来 插入 加 载 和 存储 指令 ， 以 获得 和 存 
储 内 存 中 的 值 。 使 用 VirtRegMap::assignVirt2Phys(vreg，preg) 函 数 来 


实现 从 虚拟 寄存 器 到 物理 寄存 器 的 映射 。 


寄存 器 分 配器 扮演 的 另 一 个 重要 角色 就 是 SSA 的 析 构 。 由 于 传统 的 
机 器 指令 集 不 文 持 phi 指 令 ， 所 以 常 肖 会 用 其 他 指令 来 蔡 换 它 以 生成 机 
器 码 。 传 统 的 方式 是 用 copy 指 令 来 替换 phi 指 令 。 


在 这 一 阶段 之 后 才 真 正 实 施 物 理 寄 存 器 映射 。LLVM 中 有 4 种 寄存 
需 分 配 的 实现 ， 分 别 有 4 种 将 虚拟 寄存 器 映射 到 物理 寄存 露 的 算法 。 在 
这 里 不 再 更 述 算法 的 细节 ， 如 果 对 此 有 兴趣 ， 可 以 参见 下 一 市 。 


HWZ p] 


。 关于 LLVM 中 的 更 多 算法 ， 请 参见 lib/CodeGen/ 目 录 中 的 源码 : 
e 

Lib/CodeGen/RegAllocBasic.cpp 
Lib/CodeGen/RegAllocFast.cpp 
Lib/CodeGen/RegAllocGreedy.cpp 
Lib/CodeGen/RegAllocPBQP.cpp 


o 
o 
o 
o 
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插入 头 尾 Cprologue-epilogue) 代码 包括 栈 展开 、 完 成 函数 布局 、 
保存 被 调用 者 保存 〈callee-saved) 寄存 器 、 发 射 头 尾 代 码 。 除 此 之 外 ， 
蔡 换 为 适当 的 引用 。 这 个 Pass 在 寄存 器 分 配 阶 段 
之 后 运行 。 


详细 步 又 


基本 框架 和 重要 消 数 定义 于 PrologueEpilogueInserter 类 ， 如 下 : 





e. 头 尾 代码 插入 器 Pass 作 用 于 机 器 函数 ， 因 此 它 继 承 了 
MachineFunctionPass 类 ， 它 的 构造 函数 初始 化 这 个 Pass: 


Class PEI : public MachineFunctionPass { 
public: 
static char ID; 
PEI() : MachineFunctionPass(ID) { 
initializePEIPass(*PassRegistry: :getPassRegistry()); 


j 


。 关中 定义 了 多 个 辅助 函数 ， 用 于 插入 头 尾 代码 : 


void calculateSets(MachineFunction &Fn); 

void calculateCallsInformation(MachineFunction &Fn); 

void calculateCalleeSavedRegisters(MachineFunction &Fn); 

void insertCSRSpillsAndRestores(MachineFunction &Fn); 

void calculateFrameObjectOffsets(MachineFunction &Fn); 

void replaceFrameIndices(MachineFunction &Fn); 

void replaceFrameIndices(MachineBasicBlock *BB, 
MachineFunction &Fn, 

int &SPAdj); 
void scavengeFrameVirtualRegs(MachineFunction &Fn); 


e. TNI EMS = RZ insertPrologEpilogCode(): 


void insertPrologEpilogCode(MachineFunction &Fn); 


e 这 个 Pass 首 先 执行 rnOnFunction0 函 数 ， 代 码 中 的 注释 说 明了 它 执 
行 的 多 个 操作 : 计算 调用 栈 大 小 、 调 整 栈 上 变量 、 为 调用 者 保存 寄 
存 器 插入 洲 出 (spil) 代码 、 计 算 实 际 栈 帧 人 往 移 、 为 函数 插入 头 尾 
代码 、 用 实际 栈 帧 偏 移 蔡 换 抽 象 栈 帧 索引 等 : 





bool PEI::runOnMachineFunction(MachineFunction &Fn) { 

const Function* F = Fn.getFunction(); 

const TargetRegisterInfo *TRI = Fn.getSubtarget(). 
getRegisterInfo(); 

const TargetFrameLowering *TFI - Fn.getSubtarget(). 
getFrameLowering(); 


assert(!Fn.getRegInfo().getNumVirtRegs() && "Regalloc 
must assign all vregs"); 


RS = TRI-»requiresRegisterScavenging(Fn) ? new 
RegScavenger() : nullptr; 
FrameIndexVirtualScavenging = TRI- 
>requiresFrameIndexScavenging( 
Fn); 


// 为 函数 的 帧 信息 计算 MaxcallFrameSize 和 AdjustsStack 变 量 ， 消 除 伪 调用 代 





fi 
calculateCallsInformation(Fn); 


// 人 允许 目标 平台 对 函数 做 一 些 调整 ， 例 如 在 calculateCcalleeSavedRegisters 
之 前 调 

// 用 UsedPhysRegs 

TFI->processFunctionBeforeCalleeSavedScan(Fn, RS); 

// 扫描 函数 ， 以 修改 调用 者 保存 寄存 器 ， 插 入 溢出 代码 

calculateCalleeSavedRegisters(Fn); 


// 确定 CSR 溢 出 /恢复 代码 的 位 置 ， 溢 出 代码 放 在 入 口 块 ， 恢 复 代 码 放 在 返回 块 。 
calculateSets(Fn); 


// 增加 保存 /恢复 调用 者 保存 寄存 器 的 相关 代码 
if (!F->hasFnAttribute(Attribute: :Naked) ) 
insertCSRSpillsAndRestores(Fn); 










































































// 在 栈 帧 确定 之 前 ， 允 许 目标 平台 对 函数 做 最 后 修改 
TFI->processFunctionBeforeFrameFinalized(Fn, RS); 


// 为 所 有 抽象 栈 对 象 计 算 真实 的 栈 帧 偏 移 
calculateFrameObjectOffsets(Fn); 


' S 此 函数 用 于 为 任意 堆栈 变量 或 已 调用 函数 调整 所 需 栈 帧 。 
此 ， 在 
// 这 个 函数 之 前 需要 调用 calculateCcalleeSavedRegisters() 函 数 以 设置 
//AdjustsStack 和 MaxCallFrameSize 变 量 
if (!F->hasFnAttribute(Attribute: :Naked) ) 
insertPrologEpilogCode(Fn); 


// 用 物理 寄存 器 引用 和 真实 的 偏 移 来 蔡 换 所 有 的 MO_FrameIndex 操 作 数 


replaceFrameIndices(Fn); 
























































// 如 果 需 要 寄存 器 清扫 (scavenge) ， 我 们 会 通过 post -pass 来 打扫 已 插入 的 帧 
索引 消除 
// 虚 拟 寄 存 器 
if (TRI->requiresRegisterScavenging(Fn) && 
FrameIndexVirtualScavenging ) 
scavengeFrameVirtualRegs(Fn); 



































// 清理 虚拟 清扫 产生 的 任意 虚拟 寄存 器 
Fn.getRegInfo().clearVirtRegs(); 


// 超出 栈 大 小 限制 时 给 出 警告 
MachineFrameInfo *MFI = Fn.getFrameInfo(); 
uint64_t StackSize = MFI->getStackSize(); 
if (WarnStackSize.getNumOccurrences() > 0 && 
WarnStackSize « StackSize) ( 
DiagnosticInfoStackSize DiagStackSize(*F, StackSize); 
F->getContext().diagnose(DiagStackSize); 














} 

delete RS; 
ReturnBlocks.clear(); 
return true; 


I 


e. TEN LÆRI H E K BU insertPrologEpilogCode()pai Zt. "t E A] 
用 TargetFrameLowering 对 象 ， 根 据 相 应 的 平台 为 函数 插入 头 代 码 。 
对 于 函数 的 每 个 基本 块 ， 检 查 是 否 有 返回 语句 ， 若 是 则 插入 尾 代 
个 。 





void PEI::insertPrologEpilogCode(MachineFunction &Fn) { 
const TargetFrameLowering &TFI = *Fn.getSubtarget(). 
getFrameLowering(); 


// 为 函数 插入 头 代 码 
TFI.emitPrologue(Fn); 


// 在 每 个 退出 区 块 中 插入 尾 代 码 保存 被 调 者 保存 寄存 器 
for (MachineFunction::iterator I = Fn.begin(), E = 
Fn.end(); I !- E; ++I) { 
// 如 果 最 后 一 条 指令 是 return， 插 入 尾 代码 
if (!I->empty() && I->back().isReturn()) 
TFI.emitEpilogue(Fn, *I); 
} 


AE "d 如 果 有 必要 ， 发 射 额外 代码 以 支持 分 段 堆栈 。 在 这 种 情况 下 ， 链 接 到 一 个 支持 
分 段 堆栈 
// 的 运行 时 (libgcc 就 是 其 中 之 一 ) ， 会 导致 在 多 个 小 块 地 址 分 配 栈 空间 ， 而 不 
是 连续 的 
// 大 块 内 存 。 
if (Fn.shouldSplitStack() ) 
TFI.adjustForSegmentedStacks(Fn); 


e 如 果 在 Erlang/0TP 运 行 时 加 载 了 HiPE 的 本 地 代码 ， 需 要 发 射 额外 代码 来 显 式 
处 理 栈 。 
// 方法 和 分 段 堆栈 相似 ， 但 是 采用 了 不 用 的 条 件 检查 ， 以 及 另外 的 分 配 栈 空 间 的 BIF。 
if (Fn.getFunction()->getCallingConv() == 
CallingConv: :HiPE) 
TFI.adjustForHiPEPrologue(Fn); 
} 


LEER 


前 面 的 代码 调用 了 TargetFrameLowering 类 的 emitEpilogue0 和 
emitProlo gue0 函 数 ， 这 会 在 之 后 章节 的 特定 平台 栈 帧 lowering 做 解释 。 
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代码 发 射 阶段 把 代码 生成 器 的 抽象 层 〈 例 如 MachineFunction、 


MachineInstr 类 ) 降低 为 机 器 码 抽象 屋 〈 例 如 MCInst、MCStreamer 


类 ) 


。 这 一 阶段 的 重要 类 有 平台 无 关 的 AsmPrinter 类 ， 特 定 平 全 的 


AsmpPrinter 子 类 、TargetLoweringObjectFile 类 。 


机 器 码 (MC) 层 负 责 发 射 由 标签 dabel) 、 指 导 (directive) 、 指 


令 组 成 的 对 象 文件 ， 而 CodeGen 层 则 由 MachineFunctions、 
MachineBasicBlock, MachineIns ”tructions 组 成 。 这 一 阶段 的 关键 类 是 
MCStreamer 类 ， 它 由 汇编 器 的 API 组 成 ， 由 诸如 EmitLabel、 
EmitSymbolAttribute、SwitchSection 等 组 成 ， 直 接 与 上 述 的 汇编 层 指导 
相对 应 。 


为 目标 平台 发 射 代码 有 4 个 重要 的 工作 需要 实现 。 





为 目标 平台 定义 AsmPrinter 的 子 类 。 这 个 类 需要 实现 主要 的 lowering 
任务 ， 将 MachineFunctions 函 数 转 为 MC 结 构 。AsmPrinter 基 类 提供 
了 很 多 可 以 复 用 的 函数 和 例 程 来 帮助 构建 特定 平台 的 AsmPrinter 

类 ， 你 只 需要 复写 一 部 分 即 可 。 如 果 你 需要 为 你 的 平台 实现 ELF、 
COFF 或 者 MachO 这 些 格式 ， 那 也 是 很 容易 的 ， 你 可 以 从 
TargetLoweringObjectFile 中 复 用 大 量 的 公共 逻辑 。 

实现 平台 的 指令 打印 机 (instruction printer) 。 指 令 打 印 机 输入 
MCInst 类 ， 并 以 文本 形式 输出 到 raw_ostream 类 中 。 大 部 分 打印 逻 
辑 可 以 在 .td 文件 中 直接 定义 ， 比 如 像 增 加 $dst、$src1、$src2 这 
样 ， 但 是 你 仍然 需要 实现 打印 操作 数 (operands) 的 部 分 。 

你 还 需要 将 MachineInstr 类 转化 成 MCInst 类 。 这 一 过 程 一 般 在 
<target>MCInstLower.cpp 文 件 中 实现 。 同 底层 指令 转化 的 过 程 通常 
是 平台 相关 的 ， 并 且 需 要 将 跳 转 表 、 常 量 池 索 引 、 全 局 变量 地 址 等 
这 些 上 层 的 概念 统统 转化 成 对 应 的 MCLables。 这 一 步 也 需要 将 一 
些 伪 指 令 (pseudo ops) 用 真正 的 机 器 指令 蔡 代 。 最 终生 成 的 
MCInsts， 束 可 以 用 来 编码 或 打印 成 文本 形式 的 汇编 码 。 

如 果 你 想 直 接 文 持 .o 文 件 的 输出 ， 或 者 实现 目 己 的 汇编 右 ， 你 可 以 
实现 一 个 MCCodeEmitter 的 子 类 ， 它 的 任务 是 将 MCInsts 转 化 成 机 器 
码 字 节 流 〈code bytes) 并 进行 重 定 位 〈relocations) 。 




















详细 步 又 


我 们 来 看 看 lib/CodeGen/AsmPrinter/AsmPrinter.cpp 文 件 的 AsmPrinter 
基 类 的 一 些 重要 函数 。 


e EmitLinkage(): 这 个 函数 发 射 给 定 函 数 和 变量 的 链接 。 


void AsmPrinter::EmitLinkage(const GlobalValue *GV, 
MCSymbol *GVSym) const ; 


e EmitGlobalVarible(): 这 个 函数 给 .s 文 件 发 射 指 定 的 全 局 变量 。 
void AsmPrinter::EmitGlobalVariable(const GlobalVariable *GV); 
e EmitFunctionHeader(): 这 个 函数 发 射 当 前 函数 的 函数 头 。 
void AsmPrinter: :EmitFunctionHeader ( ); 
e EmitFunctionBody(): 这 个 函数 发 射 函 数 体 。 


void AsmPrinter::EmitFunctionBody(); 





。 EmitJumpTableInfo(): XA PR BACH 7 BU ER BUDE Ze IT Ll ZEB Fl 
当前 的 输出 流 。 


void AsmPrinter::EmitJumpTableInfo(); 


。 EmitJumpTableEntry(): 这 个 函数 发 射 特定 MachineBasicBlock 类 的 
函数 跳 转 表 条 目 到 当前 流 。 


void AsmPrinter: :EmitJumpTableEntry(const 
MachineJumpTableInfo *MJTI, const MachineBasicBlock *MBB, 
unsigned UID) const; 


e EmitInt(): 这 个 函数 发 射 8 位 、16 位 、32 位 整数 。 


void AsmPrinter::EmitInt8(int Value) const { 
OutStreamer.EmitlIntValue(Value, 1); 
} 


void AsmPrinter::EmitInt16(int Value) const { 
OutStreamer.EmitIntValue(Value, 2); 
} 


void AsmPrinter::EmitInt32(int Value) const { 
OutStreamer.EmitlIntValue(Value, 4); 
} 


关于 代码 发 射 的 具体 实现 ， 可 以 参见 
lib/CodeGen/AsmPrinter/AsmpPrinter.cpp 文 件 。 需 要 注意 的 一 件 很 重要 的 
事 是 ， 这 个 类 使 用 OutStreamer 类 的 实例 来 输出 汇编 指令 。 而 特定 平台 的 
代码 发 射 将 会 在 之 后 的 章节 介绍 。 


尾 调用 优化 


本 节 介 绍 LLVM 的 尾 调用 优化 。 尾 调用 优化 指 的 是 被 调 函 数 不 创 建 
新 的 栈 帧 ， 而 是 重用 主 调 函数 的 栈 空 间 ， 因 此 减少 了 栈 空间 的 使 用 ， 也 
减少 了 相互 递归 函数 返回 的 开销 。 


准备 工作 


EAN iti ERR DA PB LRA o 





安装 lc 工具 。 
。tailcallopt 选 项 必须 可 用 。 
。 测试 代码 包含 尾 调 用 。 


详细 步 又 


1. 检查 尾 调用 优化 的 测试 代码 : 


$ cat tailcal1.11 
declare fastcc i32 @tailcallee(i32 inreg %a1, i32 inreg %a2, 
132 %a3, 132 %a4) 
define fastcc i32 @tailcaller(i32 %in1, i32 %in2) { 
%11 = add i32 %in1, %in2 
%tmp = tail call fastcc i32 @tailcallee(i32 inreg %in1, i32 inr 
132 %in1, 132 %11) 
ret 132 %tmp 
} 





2. 使 用 -tailcallopt 选 项 运行 lc 工具 ， 编 译 测 试 代 码 ， 产 生 尾 调用 优 
化 过 的 汇编 文件 : 


$ llc -tailcallopt tailcall.ll 


3. 输出 的 汇编 码 为 : 


$ cat tailcall.s 
. text 
.file "tailcall.11" 
.globl tailcaller 
.align 16, 0x90 
.type tailcaller,Q function 
tailcaller: 4 @tailcaller 
.cfi startproc 
4 BB#0: 
pushq %rax 
.Ltmpo: 
.cfi_def_cfa_offset 16 
# kill: ESI<def> ESI<kill> RSI<def> 
# kill: EDI<def> EDI<kill> RDI<def> 
leal (%rdi,%rsi), %ecx 
# kill: ESI<def> ESI<kill> RSI<kill> 
movl %edi, %edx 
popq %rax 
jmp tailcallee # TAILCALL 
. Lfunc_endo 
.Size tailcaller, .Ltmpi-tailcaller 
.cfi endproc 


.section ".note.GNU-stack","",@progbits 


4. 不 使 用 -tailcallopt 选 项 调用 llc 工 具 编译 ， 再 次 得 到 汇编 码 : 








$ llc tailcall.ll -o tailcalli.s 


5. 使 用 cat 命 令 输出 : 


$ cat tailcalli.s 
.text 
.file "tailcall.11" 
.globl tailcaller 
.align 16, 0x90 
.type tailcaller,Qfunction 
tailcaller: # Qtailcaller 
.cfi startproc 


# BBZ0: 
# kill: ESI<def> ESI<kill> RSI<def> 
# kill: EDI<def> EDI<kill> RDI<def> 
leal (%rdi,%rsi), %ecx 
# kill: ESI<def> ESI<kill> RSI<kill> 
movl %edi, %edx 
jmp tailcallee # TAILCALL 
.Lfunc_endo: 
.Size tailcaller, .Ltmp0-tailcaller 
.cfi_endproc 
.section ".note.GNU-stack","",@progbits 


使 用 diff 工 具 比 较 两 个 汇编 文件 ， 这 里 用 了 meld 工 上 只， 如 下 图 所 
ZN o 


CER 


尾 调 用 优化 是 一 种 编译 需 优 化 技术 ， 目 的 在 于 减少 函数 调用 的 开 
销 ， 它 能 够 在 不 创建 新 的 栈 帧 不 使 用 男 外 的 栈 空间 )〉 的 情况 下 进行 函 
数 调用 。 不 过 这 个 优化 有 前 提 条 件 ， 函 数 调 用 指令 必须 在 函数 的 最 后 ， 
于 是 主 调 函 数 不 再 需要 当前 的 栈 帧 ， 仅 仅 只 要 调用 相应 的 函数 〈 其 他 的 
函数 或 者 它 目 己 ) ， 然 后 返回 被 调 者 的 返回 值 。 尾 调用 优化 使 得 尾 递归 
函数 只 需要 常量 且 有 限 的 栈 空间 。 为 了 进行 优化 ， 有 时 候 还 会 改变 代码 
本 喘 以 答 试 进行 尾 调用 优化 ， 所 以 尾 调 用 优化 并 不 仅仅 适用 于 特定 的 村 


式 。 








在 之 前 的 测试 实例 中 ， 因 为 尾 调用 优化 的 缘故 多 了 两 条 push-pop 指 
令 。 在 LLVM 中 ， 尾 调用 优化 是 由 特定 平台 的 ISelLowering.cpp 文 件 实现 
的 ， 对 x86 来 说 ， 就 是 X86ISelLowering.cpp 文 件 : 


The code in function SDValue X86TargetLowering::LowerCall (...... 
bool IsMustTail = CLI.CS && CLI.CS->isMustTailCall(); 
if (IsMustTail) { 
// 强制 转 为 尾 调用 ， 校 验 规则 能 够 保证 不 改变 返回 地 址 而 成 功 尾 调用 。 
isTailCall = true; 
} else if (isTailCall) { 
// 检查 是 否 是 尾 调用 
isTailCall = IsEligibleForTailCallOptimization(Callee, 
CallConyv, 

















isVarArg, SR != NotStructReturn, 

MF.getFunction()->hasStructRetAttr(), 
CLI.RetTy, 

Outs, OutVals, Ins, DAG); 


当 传 递 了 tailcallopt 参 数 时 上 面 的 代码 就 用 于 调用 Is Eligible ForTail- 
CallOptimization() 函 数 ， 它 来 决定 是 否 进 行 尾 调用 优化 ， 之 后 再 由 代码 
生成 器 具体 实施 。 


元 种 调用 优化 


本 节 介 绍 LLVM 兄 弟 调用 (sibling call) 优化 。 兄 弟 调用 优化 是 尾 
调用 优化 的 特例 ， 当 被 调 者 和 调用 者 函数 签名 相似 的 时 候 ， 即 返回 值 类 
型 和 函数 参数 相 匹配 ， 就 能 进行 兄弟 调用 优化 了 。 


准备 工作 


为 兄弟 调用 编写 测试 实例 ， 保 证 调用 者 和 被 调 者 有 相同 的 调用 约定 
(C 或 者 fastcc) ， 并 且 在 尾部 位 置 是 一 个 尾 调 用 : 








$ cat sibcall.1l 
declare i32 Qbar(i32, i32) 


define i32 Qfoo(i32 %a, i32 *b, i32 %c) ( 
entry: 


%0 = tail call i32 @bar(i32 %a, i32 %b) 
ret 132 %0 


Y LE TEX 
详细 步骤 

1. 用 lc 工具 进行 编译 ， 生 成 汇编 码 : 
$ llc sibcall.11 

2. 用 cat 命 令 查 看 生成 的 汇编 码 : 


$ cat sibcall.s 
.text 
.file "sibcall.11" 
.globl foo 


.align 16, 0x90 
.type foo, @function 


foo: # @foo 
.cfi_startproc 

# BBZ0: # "entry 
Jmp bar 4 TAILCALL 

.Lfunc endO0: 


.Size foo, .Ltmp0-foo 
.cfi endproc 


.section ".note.GNU-stack","",@progbits 


LEER 


匈 第 调用 优化 是 尾 调用 优化 的 一 个 特例 ， 它 能 够 在 尾 调用 上 自动 实 
施 而 不 需要 传递 tailcallopt 选 项 。 兄 第 调用 优化 和 尾 调用 优化 的 方式 相 
似 ， 但 兄 第 调用 优化 能 够 自动 进行 并 且 不 需要 改变 ABI。 对 于 兄 第 调用 
来 说 ， 调 用 者 和 被 调 者 函数 签名 要 相似 ， 因 为 当主 调 函 数 〈( 是 一 个 尾 北 
归 函 数 ) 在 被 调 函 数 完成 任务 后 清理 被 调 函 数 的 参数 时 ， 如 果 被 调用 函 
数 超出 参数 空间 限制 对 一 个 需要 更 多 栈 空间 来 存储 参数 的 图 数 进 行 兄 毗 
调用 ， 那 么 就 会 造成 内 存 泄漏 。 











[11CSE 算 法 : CSE 算 法 用 于 消除 如 下 的 元 余 计算 : a=b*ct+g 
b * c + ej， 在 这 里 b * c 被 计算 了 两 次 ， 这 是 不 必要 的 ， cru DAE RL 
成 : tmp =b*c;a=tmp+g;d=tmp+e;。 一 一 译 者 注 


第 8 章 ” 实 现 LLVM 后 端 


本 章 涵 盖 以 下 话题 。 


定义 寄存 器 和 寄存 右 集 合 
定义 调用 约定 

定义 指令 集 

实现 栈 Wilowering 


增加 指令 编 
子平 名 支持 
多 指令 lowering 


平台 注册 


概述 


编译 器 的 最 终 目 标 是 产生 目标 平台 的 代码 ， 或 者 是 产生 汇编 码 ， 进 
而 能 够 通过 汇编 器 转 为 目标 代码 并 能 够 在 真实 的 便 件 上 执行 。 为 了 得 到 
汇编 码 ， 编 译 器 需要 知道 目标 机 器 架构 的 各 个 方面 一 一 寄存 器 、 指 令 
PR SNC MUSEI E 


LLVM 有 上 自己 的 定义 目标 机 器 的 方式 tablegen， 通 过 它 来 指定 
目标 的 寄存 堪 、 指 令 集 、 调 用 约定 等 ， 并 且 tablegen 函 数 以 编程 的 方式 
绥 解 了 描述 一 套 架 构 属 性 所 带 来 的 困扰 。 


LLVM 的 后 端 有 一 套 流水 线 架 构 ， 指 令 经 历 了 许多 阶段 ， 从 LLVM 
IR 到 SelectionDAG、MachineDAG、MachineInstr， 最 终 到 MCInst。 


IR 首 先 被 转 为 SelectionDAG (DAG 指 的 是 有 向 无 环 图 ) ， 之 后 
SelectionDAG 会 被 合法 化 (目标 平台 不 支持 的 指令 会 被 转换 成 合法 的 指 
A) ， 接 着 转 为 MachineDAG (基本 上 是 针对 后 端的 指令 选择 ) 。 


CPU 线性 地 执行 指令 序列 ， 指 令 调度 阶段 的 一 个 目的 就 是 分 配 指令 
的 执行 顺序 ， 把 DAG 转 换 成 线性 的 指令 。LLVM 的 代码 生成 器 使 用 了 一 
些 聪明 的 局 发 式 算法 来 尽量 产生 更 快 的 代码 ， 例 如 寄存 器 压力 减少 。 在 
a E E 


本 章 描 述 了 如 何 从 头 构建 LLVM TOY 后 端 。 最 终 ， 我 们 能 够 使 用 这 
个 样 例 TOY 后 端 来 生成 汇编 代码 。 


EBL Je m 


本 章 实 现 的 样 例 后 端 是 一 个 简单 的 RISC 风 格 的 架构 ， 它 有 很 少 的 
寄存 器 (I0~~r3) 、1 个 栈 寄存 器 (sp) 和 1 个 链接 寄存 器 Cr) 用 于 存储 
返回 地 址 。 


























此 TOY 后 端 遵循 的 调用 约定 和 ARM 架 构 相 似 ， 传 递 给 函数 的 参数 
通过 寄存 器 集合 r0~rl 存 储 ， 而 返回 值 通过 r0 存 储 。 





Ps yo HE c HE AS A 
定义 寄存 器 和 寄存 器 集合 
本 节 介 绍 如 何 使 用 .td 文件 来 定义 寄存 器 和 寄存 器 集合 ， 之 后 通过 


tablegen 函 数 可 以 把 .td 文件 转 为 ,inc 文件 ， 而 这 些 文件 可 以 在 .cpp 文 件 中 
通过 ##include 声 明 引 入 ， 进 而 应 用 其 中 定义 的 寄存 器 。 


准备 工作 


如 前 面 所 定义 的 ， 我 们 的 TOY 目 标 机 器 有 4 个 普通 寄存 器 〈r0 一 
r3) 、1 个 栈 寄存 器 (sp) 、1 个 链接 寄存 器 dr) 。 这 些 内 容 可 以 在 
TOYRegisterInfo.td 文 件 中 指定 。tablegen 函 数 提供 了 Register 类 ， 通 过 继 
承 这 个 类 ， 可 以 表示 这 些 寄 存 器 。 


详细 步 又 


执行 以 下 步骤 ， 通 过 目标 平台 的 摘 述 文件 来 定义 后 端 架 构 。 
1. 在 lib/Target 目 录 下 创建 一 个 TOY 目 录 : 











$ mkdir llvm root directory/lib/Target/TOY 


2. 在 TOY 目 录 下 创建 TOYRegisterInfo.td 文 件 : 


$ cd llvm root directory/lib/Target/TOY 
$ vi TOYRegisterInfo.td 





3. E LB EAR. a IB]. AF AY AR ARR: 


class TOYReg«bits«i16» Enc, string n» : Register<n> { 
let HWEncoding - Enc; 


let Namespace = "TOY"; 


} 
foreach i = 0-3 in { 
def R#i : R<i, "r"#i >; 
} 
def SP : TOYReg<13, "sp'»; 


def LR : TOYReg<14, "lr"»; 


def GRRegs : RegisterClass<"TOY", [132], 32, 
(add RO, R1, R2, R3, SP)»; 


LEER 


tablegen 函 数 处 理 .td 文 件 以 生成 .inc 文 件 ， 并 用 枚 举 类 型 来 表示 寄存 
器 ， 于 是 我 们 能 够 在 .cpp 文 件 中 引用 这 些 枚 举 类 型 。 例 如 ，r0 寄 存 器 可 
以 用 TOY::R0 引 用 。 在 我 们 构建 LLVM 项 目 时 会 生成 这 些 .inc 文 件 。 








。 关于 更 多 高 级 架构 (例如 ARM) 的 寄存 器 定义 ， 请 参见 LLVM 源 码 
库 的 lib/Target/ARM/ARMRegisterInfo.td 文 件 。 


定义 调用 约定 


调用 约定 指 的 是 值 如 何 传递 给 函数 以 及 如 何 从 函数 返回 。 在 TOY 架 
构 中 ， 两 个 参数 通过 r0 和 rl 这 两 个 寄存 器 传递 ， 剩 下 的 通过 栈 传递 。 本 
节 将 介绍 如 何 定义 调用 约定 ， 它 会 通过 函数 指针 被 ISelLowering 〈 在 第 6 
章 “ 平 台 无 关 代码 生成 器 ”的 指令 选择 lowering 阶 段 提 及 ) 使 用 。 


调用 约定 在 TOYCallingConv.td 文 件 中 定义 ， 它 主要 包含 两 块 内 容 : 
返回 值 约定 和 参数 传递 约定 。 返 回 值 约定 指 的 是 返回 值 会 如 何 传递 以 及 
通过 哪个 寄存 器 传递 ， 参 数 传递 约定 指 的 是 参数 通过 栈 还 是 寄存 器 传 
递 ， 以 及 通过 哪个 寄存 器 传递 。 在 定义 TOY 平 台 的 调用 约定 时 ， 会 继承 


CallingConv 类 。 


详细 步 又 


执行 以 下 步 又， 实现 调用 约定 : 
1. 在 lib/TargeVTOY/ 目 录 下 ， 创 建 TOYCallingConv.td 文 件 : 


$ vi TOYCallingConv.td 


2. 在 文件 中 定义 返回 值 约定 ， 如 下 : 


def RetCC_TOY : CallingConv<[ 
CCIfType<[i32], CCAssignToReg<[R0]>>, 
CCIfType<[i32], CCAssignToStack<4, 4>> 

P; 


, 


3. 同样 ， 定 义 参 数 传递 约定 ， 如 下 : 


def CC_TOY : CallingConv<[ 
CCIfType<[i8, i16], CCPromoteToType<i32>>, 
CCIfType<[i32], CCAssignToReg<[RO, R1]>>, 
CCIfType<[i32], CCAssignToStack<4, 4>> 


4. 定义 被 调 者 保存 寄存 器 (callee saved) 集合 : 


def CC_Save : CalleeSavedRegs<(add R2, R3)>; 


LR Re 


在 前 面 你 看 到 的 .td 文件 中 ， 指 定 了 32 位 整数 的 返回 值 会 存储 在 r0 寄 
存 器 当中 。 当 传递 参数 给 函数 时 ， 前 两 个 参数 会 存储 于 r0 和 r1 寄 存 器 。 
同样 ， 文 件 也 指定 了 任何 数据 类 型 ， 例 如 8 位 整数 或 16 位 整数 ， 都 会 提 
升 人 至 32 位 整数 。 

tablegen 函 数 会 为 此 生成 TOYCallingConv.inc 文 件 ， 在 


TOYISelLowering.cpp 文 件 中 被 引用 。 同 时 会 生成 两 个 用 于 定义 参数 处 
理 方 式 的 目标 hook 函 数 ，LowerFormalArguments0 和 LowerReturn()。 
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e 关于 高 级 架构 (例如 ARM) 实现 的 更 多 内 容 ， 请 参见 
lib/Target/ARM/ARM- CallingConv.td 文 件 。 


定义 指令 集 


一 个 平台 的 指令 集 的 定义 包含 多 种 此 平台 的 特性 。 本 节 介 绍 如 何 为 
目标 平台 定义 指令 集 。 

指令 目标 描述 文件 定义 了 3 样 内 容 : 操作 数 、 汇 编 字 符 串 、 指 令 格 
式 。 有 具体 包括 定义 或 输出 列表 ， 以 及 使 用 或 输入 列表 。 其 中 也 有 不 同 的 
操作 类 ， 如 Register 类 、 立 即 数 ， 以 及 更 复杂 有 的 registertimm 操 作 数 。 


T. 本 节 以 一 个 简单 的 添加 指令 〈 它 用 两 个 寄存 器 作为 操作 数 ) 定义 来 
示 。 


详细 步 又 


同样 是 通过 目标 描述 文件 来 定义 指令 集 ， 执 行 以 下 步骤 。 
1. 在 lib/Target/TOY/ 目 录 下 创建 TOYInstr.Info.td 文 件 : 








$ vi TOYInstrInfo.td 


2. 为 采用 两 个 寄存 器 作为 操作 数 的 add 指 令 指定 操作 数 、 汇 编 字符 
B. BA dif: 





def ADDrr : InstTOY«(outs GRRegs:$dst), 
(ins GRRegs:$srci, GRRegs:$src2), 
"add $dst, $srci,z$src2", 

[(set i32:$dst, (add i32:$src1, i32:$src2))]»; 


LEER 


从 寄存 器 到 寄存 器 的 add 指 令 有 3 个 32 位 整 型 操作 数 ， 都 是 寄存 器 


其 中 $dst 作 为 结果 操作 数 ，$src1 和 $src2 作 为 输入 操作 数 ， 它 们 都 是 
General 。” Register 类 型 类 ;指令 的 汇编 字符 串 ， 如 32 位 整数 类 型 的 "add 
$dst, $src1, $src2"。 


因此 ， 对 两 个 寄存 器 执行 add 指 令 产 生 的 汇编 码 如 下 : 





add rO, rO, r1 


di 这 条 汇编 码 表示 将 r0 和 rl 寄存 器 中 的 值 相 加 ， 结 果 存 储 于 r0 寄 存 
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e 许多 指令 都 有 相同 类 型 的 指令 格式 ， 例 如 像 add、sub 等 这 样 的 ALU 
指令 ， 它 们 的 格式 都 为 "dst，srcl1，src2"， 这 个 多 类 被 用 于 定义 公 
共 属 性 。 关 于 高 级 架构 (例如 ARM) 指令 集 的 多 种 类 型 的 详细 信 
息 ， 请 参见 lib/Target/ARM/ ARMInstrInfo.td 文 件 。 


SC HUE lowering 


本 节 介 绍 目标 架构 的 栈 帧 的 lowering〈 从 高 级 抽象 到 低级 抽象 ) 。 
栈 帆 lowering 包 括 发 射 函 数 调用 的 头 尾 代 码 。 


准备 工作 


栈 帧 lowering 需 要 定义 两 个 函数 : TOY FrameLowering::emit- 
Prologue() 和 TOYFrameLowering::emitEpilogue()。 


详细 步 又 


在 lib/TargeVTOY 目 录 的 TOYFrameLowering.cpp 文 件 中 定义 以 下 函 
数 。 


1. emitPrologue 函 数 定 义 如 下 : 


void TOYFrameLowering: :emitPrologue(MachineFunction &MF) 
const { 

const TargetInstrinfo &TII = 
*MF.getSubtarget().getInstrinfo(); 

MachineBasicBlock &MBB = MF.front(); 

MachineBasicBlock::iterator MBBI = MBB.begin(); 

DebugLoc dl = MBBI != MBB.end() ? MBBI->getDebugLoc() : 

DebugLoc( ); 

uint64 t StackSize - computeStackSize(MF); 

if (!StackSize) { 

return; 

} 

unsigned StackReg = TOY::SP; 

unsigned OffsetReg = materializeOffset(MF, MBB, MBBI, 


(unsigned)StackSize); 
if (OffsetReg) { 
BuildMI(MBB, MBBI, dl, TII.get(TOY::SUBrr), StackReg) 
.addReg(StackReg) 
.addReg(OffsetReg) 
.setMIFlag(MachineInstr::FrameSetup); 
) else { 
BuildMI(MBB, MBBI, dl, TII.get(TOY::SUBri), StackReg) 
.addReg(StackReg) 
.addImm(StackSize) 
.sSetMIFlag(MachineInstr::FrameSetup); 


2. emitEpiloguePK Zi XE X. Jn F: 


void TOYFrameLowering::emitEpilogue(MachineFunction &MF, 
MachineBasicBlock &MBB) 
const ( 


const TargetInstriInfo &TII = 

*MF.getSubtarget().getinstrInfo(); 
MachineBasicBlock::iterator MBBI - 
MBB.getLastNonDebugInstr(); 

DebugLoc dl = MBBI->getDebugLoc(); 

uint64 t StackSize = computeStackSize(MF); 

if (!StackSize) { 

return; 


unsigned StackReg - TOY::SP; 
unsigned OffsetReg - materializeOffset(MF, MBB, MBBI, 
(unsigned)StackSize); 
if (OffsetReg) { 
BuildMI(MBB, MBBI, dl, TII.get(TOY::ADDrr), StackReg) 
.addReg(StackReg) 
.addReg(OffsetReg) 
.setMIFlag(MachineInstr::FrameSetup); 
) else { 
BuildMI(MBB, MBBI, dl, TII.get(TOY::ADDri), StackReg) 
.addReg(StackReg) 
.addImm(StackSize) 
.setMIFlag(MachineInstr::FrameSetup); 


3. 一 些 为 ADD 栈 操作 计算 基 址 偏 移 的 辅助 函数 : 


static unsigned materializeOffset(MachineFunction &MF, 
MachineBasicBlock &MBB, MachineBasicBlock::iterator MBBI, 
unsigned Offset) { 
const TargetInstrinfo &TII = 
*MF.getSubtarget().getinstrInfo(); 
DebugLoc dl = MBBI !- MBB.end() ? MBBI-»getDebugLoc() 
DebugLoc( ); 
const uint64 t MaxSubImm - Oxfff; 
if (Offset <= MaxSubImm) { 
return 0; 
) else { 
unsigned OffsetReg - TOY::R2; 
unsigned OffsetLo unsigned)(Offset & Oxffff); 
unsigned OffsetHi unsigned)((Offset & Oxffff0000) >> 
16); 
BuildMI(MBB, MBBI, dl, TII.get(TOY::MOVLOi16), 
OffsetReg) 
.addImm(OffsetLo) 
.SetMIFlag(MachineInstr::FrameSetup); 
if (OffsetHi) { 
BuildMI(MBB, MBBI, dl, TII.get(TOY::MOVHIi16), 
OffsetReg) 
.addReg(OffsetReg) 
.addImm(OffsetHi) 
.setMIFlag(MachineInstr::FrameSetup); 


={ 
=o 


} 
return OffsetReg; 


} 
j 


4. 计算 栈 大 小 的 辅助 函数 : 


uint64_t TOYFrameLowering::computeStackSize(MachineFunction 
&MF) const { 
MachineFramelnfo *MFI = MF.getFrameInfo(); 
uint64 t StackSize = MFI->getStackSize(); 
unsigned StackAlign = getStackAlignment(); 
if (StackAlign > 0) { 
StackSize = RoundUpToAlignment(StackSize, StackAlign); 


return StackSize; 


CE RS 


emitPrologue 函 数 首 先 计 算 栈 大 小 来 决定 是 否 需要 头 代 码 ， 然 后 计 
算 偏 移 来 调整 栈 指针 。 对 于 尾 代码 来 说 ， 同 样 需要 先 检查 是 否 需 要 尾 代 
人 码 ， 然 后 把 栈 指 针 还 原 成 函数 开始 时 的 样子 。 


例如 ， 我 们 看 看 这 段 输入 IR: 








%p = alloca i32, align 4 
store 132 2, i32* %p 

%b = load 132* %p, align 4 
%c = add nsw i32 %a, %b 


生成 的 TOY 汇 编码 如 下 : 


sub sp, sp, #4 ; prologue 
movw ri, #2 

str r1, [sp] 

add rO, rO, #2 

add sp, sp, £4 ; epilogue 
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。 关于 ARM 架 构 的 帧 lowering 信 息 ， 请 参见 
lib/Target/ARM/ARMFrame- Lowering.cpp 文 件 。 


打印 指令 


在 生成 目标 代码 的 过 程 中 ， 打 印 汇编 指令 是 很 重要 的 步骤 。 定 义 很 
多 类 以 管道 的 方式 过 滤 ， 由 之 前 定义 的 .td 文件 提供 指令 字符 串 。 


准备 工作 


打印 指令 的 第 一 步 ， 也 是 最 重要 的 一 步 ， 是 在 .tq 文 件 中 定义 指令 字 
符 串 ， 这 在 “定义 指令 集 ” 一 三 中 有 过 介绍 。 








详细 步骤 
执行 以 下 步骤。 


1. 在 TOY 目 录 下 创建 新 的 InstPrinter 目 录 : 


$ cd lib/Target/TOY 
$ mkdir InstPrinter 


2. 创建 TOYInstrFormats.td 文 件 ， 定 义 AsmString 变 量 : 


class InstTOY<dag outs, dag ins, string asmstr, list<dag> 
pattern> 
: Instruction { 

field bits<32> Inst; 

let Namespace = "TOY"; 

dag OutOperandList = outs; 

dag InOperandList = ins; 

let AsmString = asmstr; 

let Pattern = pattern; 

let Size = 4; 


3. AJ TOY InstPrinter.cpp3cff, JE XprintOperandrA Zi, AF: 


void TOYInstPrinter::printOperand(const MCInst *MI, 
unsigned OpNo, raw_ostream &O) { 
const MCOperand &Op = MI->getOperand(OpNo); 
if (Op.isReg()) ( 
printRegName(O, Op.getReg()); 
return; 


j 


if (Op.isImm()) ( 
0 << "#" << Op.getImm(); 
return; 


assert(Op.isExpr() && "unknown operand kind in 
printOperand"); 
printExpr(Op.getExpr(), 0); 


4. ETE is BRE SCS PR BOR TT EGET ait n PI 


void TOYInstPrinter::printRegName(raw ostream &OS, unsigned 
RegNo) const ( 
OS «« StringRef(getRegisterName(RegNo)).lower(); 


j 
5. 定义 一 个 打印 指令 的 函数 : 


void TOYInstPrinter::printInst(const MCInst *MI, 
raw_ostream &0,StringRef Annot) { 
printInstruction(MI, 0); 
printAnnotation(O, Annot); 


j 


6. 4E X TOYMCAsmlnfo.hfllTOYMCAsminfo.cppX fF, TRAE 
MCASMinfo 来 打印 指令 。 


TOYMCAsmInfo.h 文 件 定 义 如 下 : 


#ifndef TOYTARGETASMINFO H 
#define TOYTARGETASMINFO H 


#include "llvm/MC/MCAsmInfoELF.h" 


namespace llvm { 
class StringRef; 
class Target; 


class TOYMCAsmInfo : public MCAsmInfoELF { 
virtual void anchor(); 

public: 
explicit TOYMCAsmInfo(StringRef TT); 

}; 


) // 命名 空间 llvm 
#endif 


TOYMCAsmInfo.cpp 文 件 定义 如 下 : 


#include "TOYMCAsmInfo.h" 
#include "llvm/ADT/StringRef.h" 
using namespace llvm; 


void TOYMCAsmInfo::anchor() {} 


TOYMCAsmInfo::TOYMCAsmInfo(StringRef TT) { 
SupportsDebugInformation = true; 


Datai6bitsDirective = "\t.short\t"; 
Data32bitsDirective = "\t.long\t"; 
Data64bitsDirective = 0; 
ZeroDirective = "\t.space\t"; 
CommentString = "#"; 

AscizDirective = ".asciiz"; 


HiddenVisibilityAttr = MCSA_Invalid; 
HiddenDeclarationVisibilityAttr = MCSA_Invalid; 
ProtectedVisibilityAttr = MCSA_Invalid; 


7. 为 指令 打印 器 定义 LLVMBnuild.txt 文 件 : 


[component 90] 

type - Library 

name = TOYAsmPrinter 

parent - TOY 

required libraries - MC Support 


add_to_library_groups = TOY 


8. 定义 CMakeLists.txt: 


add_llvm_library(LLVMTOYAsmPrinter 
TOYInstPrinter.cpp 


) 


“CER 


在 重新 构建 过 LLVM 之 后 ， 只 需要 用 lc 静态 编译 工具 ， 就 能 输出 
TOY 架 构 的 汇编 码 了 。 


例如 ， 对 于 以 下 的 I 人民 ， 用 lic 工具 编译 ， 会 生成 以 下 的 汇编 码 : 








target datalayout = "e-m:e-p:32:32-11:8:32-18:8:32- 
116:16:32-164:32-f64:32-a:0:32-n32" 
target triple - "toy" 
define i32 Qfoo(i32 %a, 132 9b) { 
%c = add nsw i32 96a, %b 
ret i32 %c 


j 


$ llc foo.11 

.text 

.file "foo.11" 
.globl foo 

.type foo,Qfunction 
foo: # Qfoo 

# BBHO: £ %entry 
add rO, rO, ri 

b lr 

.Ltmpo: 

.size foo, .Ltmp0-foo 


选择 指令 


DAG 中 的 IR 指 令 需 要 被 映射 到 特定 平台 对 应 的 指令 。 同 样 ， 在 
SDAG 节 点 中 会 包含 I 民 ， 需 要 在 特定 机 器 的 DAG 节 点 上 映射。 在 指令 选择 
阶段 之 后 ， 得 到 的 结果 还 需要 进行 指令 调度 。 


准备 工作 


1. 为 了 进行 特定 机 器 的 指令 选择 ， 需 要 定义 一 个 独立 的 
TOYDAGToDAGISel 类 ， 因 此 为 了 编译 包含 这 个 类 定义 的 文件 ， 需 要 把 
文件 名 添加 到 TOY/CMakeLists.txt 文 件 中 : 








$ vi CMakeLists .txt 
add_llvm_target(... 


TOYISelDAGTODAG.cpp 


2， 在 TOYTargetMachine.h 和 TOYTargetMachine.cpp 文 件 中 添加 Pass 
AL 
Z | | : 


$ vi TOYTargetMachine.h 
const TOYInstrinfo *getInstrInfo() const override { 
return getSubtargetImpl()-»getinstrInfo(); 


j 


3. 在 TOYTargetMachine.cpp 文 件 中 增加 以 下 代码 ， 在 指令 选择 阶段 
创建 一 个 Pass: 


class TOYPassConfig : public TargetPassConfig { 
public: 


virtual bool addInstSelector(); 


}; 


bool TOYPassConfig::addInstSelector() { 
addPass(createTOYISelDag(getTOYTargetMachine())); 
return false; 


j 


详细 步 又 


WATA FIR, JENTEA WETER Z 


1. 创建 TOYISelIDAGToDAG.cpp 文 件 : 


$ vi TOYISelDAGTODAG.cpp 


#include "TOY.h" 

#include "TOYTargetMachine.h" 

Zinclude "llvm/CodeGen/SelectionDAGISel.h" 
#include "llvm/Support/Compiler .h" 
#include "llvm/Support/Debug.h" 

#include "TOYInstrInfo.h" 


3. ^E X TOYDAGTODAGISel25, 47K Ø SelectionDAGISelZS$, Jl 
F: 


class TOYDAGTODAGISel : public SelectionDAGISel { 
const TOYSubtarget &Subtarget; 


public: 
explicit TOYDAGTODAGISel(TOYTargetMachine &TM, 
CodeGenOpt::Level OptLevel) 
: SelectionDAGISel(TM, OptLevel), Subtarget(*TM. 
getSubtargetiImpl()) {} 


}; 





4. 这 个 类 中 要 定义 的 最 重要 的 函数 是 Select)， 它 依据 机 器 指令 返回 
一 个 SDNode 对 象 。 


SDNode *Select(SDNode *N); 


SDNode *TOYDAGTODAGISel::Select(SDNode *N) { 
return SelectCode(N); 
} 


5. 男 一 个 重要 的 函数 是 定义 地 址 选择 函数 ， 它 会 计算 加 载 、 存 储 操 
作 的 基 址 和 偏 移 。 


声明 如 下 : 


bool SelectAddr(SDValue Addr, SDValue &Base, SDValue &Offset); 


进一步 定义 如 下 : 


bool TOYDAGTODAGISel::SelectAddr(SDValue Addr, SDValue 
&Base, SDValue &Offset) { 
if (FramelndexSDNode *FIN - 
dyn_cast<FrameIndexSDNode>(Addr)) { 
Base = CurDAG->getTargetFrameIndex(FIN->getIndex(), 


getTargetLowering()- 
>getPointerTy()); 


Offset = CurDAG->getTargetConstant(0, MVT::132); 
return true; 


} 
if (Addr.getOpcode() == ISD::TargetExternalSymbol | | 
Addr .getOpcode() == ISD::TargetGlobalAddress | | 
Addr .getOpcode() == ISD::TargetGlobalTLSAddress) { 
return false; // 直接 调用 


Base = Addr; 
Offset = CurDAG->getTargetConstant(0, MVT::132); 
return true; 


6. ima, createTOYISelDag ”Pass 把 合法 的 DAG 转 为 TOY 平 台 的 








DAG， 并 且 为 定义 于 同一 文件 中 的 指令 调度 做 准备 : 


FunctionPass *llvm::createTOYISelDag(TOYTargetMachine &TM, 
CodeGenOpt::Level OptLevel) ( 
return new TOYDAGTODAGISel(TM, OptLevel); 


LEER 


TOYISelIDAGToDAG.cpp'# KJTOYDAGToDAGISel::Select() PK Zt H 
于 选择 DAG 节 点 的 操作 码 ， 而 TOYDAGISel: : SelectAddr0 则 用 于 选择 
DataDAG 节 点 的 addr 类 型 。 需 要 注意 的 是 ， 如 果 地 址 是 全 局 的 或 者 是 外 
部 的 ， 则 返回 false， 因 为 它 需 要 在 全 局 上 下 文中 计算 。 
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e 关于 一 些 复 杂 架 构 〈 例 如 ARM 架 构 ) 的 DAG 机 器 指令 选择 ， 请 参 
见 LLVM 源 码 库 的 lib/Target/ARM/ARMISelIDAGToDAG.cpp 文 件 。 


增加 指令 编码 


如 果 指 令 需 要 进行 编码 Ss， 即 如 何 用 位 字段 表示 ， 那 么 可 以 在 .td 文 
件 中 定义 指令 的 时 候 指定 位 字段 。 


详细 步 又 


为 了 在 定义 指令 的 时 候 包含 指令 编码 ， 需 要 执行 以 下 步 又。 


1. 对 于 注册 add 指 令 的 一 个 寄存 器 操作 数 ， 会 有 一 些 定义 的 指令 编 
码 。 指 令 的 大 小 是 32 位 的 ， 它 的 编码 如 下 : 








bits 0 to 3 -> src2, second register operand 
bits 4 to 11 -> all zeros 

bits 12 to 15 -> dst, for destination register 
bits 16 to 19 -> srci, first register operand 
bit 20 -> zero 

bit 21 to 24 -> for opcode 

bit 25 to 27 -> all zeros 

bit 28 to 31 -> 1110 


这 可 通过 在 .td 文件 中 指定 位 模式 来 实现 。 
2. 在 TOYInstrFormats.td 文 件 中 定义 名 为 Inst 的 变量 : 


class InstTOY<dag outs, dag ins, string asmstr, list<dag> 
pattern> 
: Instruction { 


field bits<32> Inst; 


let Namespace = "TOY"; 


let AsmString = asmstr; 


3. 在 TOYInstrInfo.td 文 件 中 定义 指令 编码 : 


def ADDrr : InstTOY<(outs GRRegs:$dst),(ins GRRegs:$src1, 
GRRegs:$src2) ... > { 

bits<4> src1; 
bits<4> src2; 
bits<4> dst; 

let Inst{31-25} 
let Inst{24-21} 
Let Inst{20} = 0b0; 

Let Inst{19-16} = srci; // 操作 数 1 
Let Inst{15-12} = dst; // 目标 

Let Inst{11-4} = 0b0000000; 

Let Inst{3-0} = src2; 

} 


0b1100000; 
0b1100; // 操作 码 


uou i 
e 


4. 在 TOY/MCTargetDesc/TOYMCCodeEmitter.cpp 文 件 中 ， 如 果 机 器 
指令 的 操作 数 是 寄存 器 ， 那 么 就 会 调用 编码 函数 : 


unsigned TOYMCCodeEmitter: :getMachineOpValue(const MCInst 
&MI， 
const 
MCOperand &MO, 


SmallVectorImpl<MCFixup> &Fixups, 
const 
MCSubtargetInfo &STI) const { 
if (MO.isReg()) { 
return CTX.getRegisterInfo()- 
>getEncodingValue(MO.getReg()); 


j 
5. 在 同一 个 文件 中 ， 指 定编 码 指 令 的 函数 : 


void TOYMCCodeEmitter::EncodeInstruction(const MCInst &MI, 
raw ostream &OS, SmallVectorImpl«MCFixup» &Fixups, const 
MCSubtargetInfo &STI) const { 
const MCInstrDesc &Desc - MCII.get(MI.getOpcode()); 
if (Desc.getSize() != 4) { 
llvm unreachable("Unexpected instruction size!"); 


const uint32_t Binary = getBinaryCodeForInstr (MI, 
Fixups, STI); 


EmitConstant(Binary, Desc.getSize(), OS); 
++MCNumEmitted; 
} 


CE RS 


在 .td 文件 中 ， 指 令 的 编码 通过 为 其 操作 数 、 目 标 、 参 数 状态 、 操 作 
码 来 编码 〈 指 令 每 一 位 的 存储 内 容 ) 而 实现 。 同 样 ，tablegen 会 为 .td 生 
成 .inc 文 件 ， 而 机 器 码 发 射 嚣 可 以 通过 函数 调用 来 获得 这 些 编码 。 它 编 
码 这 些 指 令 并 为 打印 指令 发 射 相同 内 容 。 
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。 关 于 一 些 复杂 架构 (例如 ARM 架 构 ) 的 指令 编码 ， 请 参见 LLVM 代 
码 库 的 lib/Target/ARM/ARMInstrInfo.td 文 件 。 


子平 台 支持 


目标 平台 可 能 还 会 有 子平 台 〈 平 台 的 变 体 ) 在 一 些 细节 的 处 理 
上 存在 不 同 ， 例 如 指令 中 操作 数 的 处 理 ， 而 这 些 子 平台 特性 在 LLVM 后 
端 中 也 得 到 了 支持 。 子 平台 可 能 包含 额外 的 指令 、 寄 存 器 、 调 度 模 型 
等 。 例 如 ARM 有 子平 台 NEON 和 THUMB，x86 有 一 些 子平 台 特 性 SSE、 
AVX 等 。 子 平台 的 指令 集 特性 有 所 不 同 ， 例 如 ARM 的 子平 台 NEON 和 
支持 向 量 指令 的 SSE/AVX，SSE/AVX 也 支持 向 量 指令 集 ， 但 它们 的 指 
令 互 不 相同 。 


详细 步 又 


本 节 介 绍 如 何在 后 端 加 入 对 子平 台 的 支持 ， 首 先 需 要 定义 一 个 继承 
TargetSubtar_getInfo 类 的 子 类 。 




















1. 创建 TOYSubtarget.h 文 件 : 


$ vi TOYSubtarget.h 


#include "TOY.h" 

#include "TOYFrameLowering.h" 

#include "TOYISelLowering.h" 

#include "TOYInstrInfo.h" 

#include "TOYSelectionDAGInfo.h" 

#include "TOYSubtarget.h" 

#include "llvm/Target/TargetMachine.h" 
#include "llvm/Target/TargetSubtargetInfo.h" 
#include "TOYGenSubtargetInfo. inc" 


3. 定义 TOYSubtarget 类 ， 它 包含 一 些 私 有 成 员 来 表示 子平 台 的 数据 
布局 、 目 标 lowering、DAG 指 令 选 择 、 目 标 帧 lowering 等 信息 : 





class TOYSubtarget : public TOYGenSubtargetInfo { 
virtual void anchor(); 


private: 

const DataLayout DL; // 计算 类 型 大 小 和 对 齐 方式 
TOYInstrInfo InstrInfo; 

TOYTargetLowering TLInfo; 

TOYSelectionDAGInfo TSInfo; 

TOYFrameLowering FrameLowering; 
InstrlItineraryData InstrItins; 


4. 声明 构造 函数 : 


TOYSubtarget(const std::string &TT, const std::string &CPU, 
const std::string &FS, TOYTargetMachine &TM); 


x 4 M38 PRU a Het x va DA VL CE B^) = 762H o 
5. 定义 返回 类 相关 数据 的 辅助 函数 : 


const InstrItineraryData *getInstrItineraryData() const override 
return &InstrItins; 


j 


const TOYInstrinfo *getInstrInfo() const override { return 
&InstrInfo; } 


const TOYRegisterInfo *getRegisterInfo() const override ( 
return &Instrinfo.getRegisterInfo(); 


j 


const TOYTargetLowering *getTargetLowering() const override { 
return &TLInfo; 


j 


const TOYFrameLowering *getFrameLowering() const override { 
return &FrameLowering; 


j 


const TOYSelectionDAGInfo *getSelectionDAGInfo() const override ( 
return &TSInfo; 


; 


const DataLayout *getDataLayout() const override { return &DL; } 


void ParseSubtargetFeatures(StringRef CPU, StringRef FS); 


6. 创建 TOYSubtarget.cpp 文 件 ， 定 义 构造 函数 : 


TOYSubtarget::TOYSubtarget(const std::string &TT, const 
std::string &CPU, const std::string &FS, TOYTargetMachine &TM) 
DL("e-m:e-p:32:32-11:8:32-18:8:32-116:16: 32-164: 32- 

f64:32-a:0:32-n32"), 
InstrliInfo(), TLInfo(TM), TSInfo(DL), FrameLowering() 
{} 


子平 台 定义 了 自己 的 数据 布局 ， 包 含 一 些 如 栈 帧 lowering、 指 令 、 


子平 台 等 信息 。 


请 参阅 





\ 


e 关于 子平 台 的 具体 实现 ， 请 参见 LLVM 源 码 中 的 
lib/Target/ARM/ARM Subtar_ get.cpp 文 件 。 


€ t © lowering 


我 们 用 实现 操作 32 位 立即 数 的 load 指 令 为 例 ， 用 两 个 指令 操作 高 低 
位 来 实现 ，MOVW 移 动 低 16 位 立即 数 ， 清 除 高 16 位 ; MOVT 移 动 高 16 
位 立即 数 。 


详细 步 又 


实现 多 指令 lowering 有 多 种 方法 ， 我 们 可 以 用 伪 指 令 Cpseudo- 
instruction) 或 者 在 选择 DAG 到 DAG 阶 段 完 成 。 


1. 如 果 不 用 伪 指 令 完成 ， 先 定 义 一 些 约束 一 一 两 条 指令 必须 是 有 
的 。MOVW 清 除 高 16 位 ， 而 其 输出 可 以 被 MOVT 读 取 来 填充 目标 的 高 
16 位 。 在 tablegen 中 可 以 指定 这 个 约束 : 


S 








def MOVLOi16 : MOV<0b1000, "movw", (ins i32imm:$imm), 

[(set i32:$dst, i32imm_lo:$imm)]>; 
def MOVHIi16 : MOV<0b1010, "movt", (ins GRRegs:$src1, 
i32imm:$imm), 





[/* 没有 模式 */]»; 


第 2 种 方式 是 在 .td 文件 定义 伪 指 令 : 





def MOVi32 : InstTOY<(outs GRRegs:$dst), (ins i32imm:$src), "", 
[(set 132:$dst, (movei32 imm:$src))]> { 
let isPseudo = 1; 


} 
2. 然后 伪 指 令 被 TOYInstrInfo.cpp 文 件 的 一 个 目标 函数 lower: 


bool 
TOYInstrInfo::expandPostRAPseudo(MachineBasicBlock::iterato 
r MI) const ( 
if (MI->getOpcode() == TOY::MOVi32)( 
DebugLoc DL = MI->getDebugLoc(); 


MachineBasicBlock &MBB = *MI-»getParent(); 


const unsigned DstReg = MI-»getOperand(0).getReg(); 
const bool DstIsDead = MI-»getOperand(0).isDead(); 


const MachineOperand &MO = MI-»getOperand(1); 


auto L016 = BuildMI(MBB, MI, DL, get(TOY::MOVLOi16), 
DstReg); 
auto HI16 = BuildMI(MBB, MI, DL, get(TOY::MOVHIii16)) 
.addReg(DstReg, RegState::Define | 
getDeadRegState(DstIsDead)) 
.addReg(DstReg); 


MBB.erase(MI); 
return true; 
} 


} 
3. 编译 整个 LLVM 项 目 : 


Slt, AGIRVex I 文件 如 下 : 


define i32 Qfoo(i32 %a) #0 { 
%b = add nsw i32 %a, 65537 ; 0x00010001 
ret 132 %b 


j 
得 到 的 汇编 码 如 下 : 


movw ri, #1 
movt ri, #1 
add rO, rO, r1 
b 1r 


LEER 


第 1 条 指令 movw， 移 动 低 16 位 的 1 并 清除 高 16 位 ， 于 是 在 r1 中 第 1 条 
会 写 入 0x00000001。 下 一 条 指令 movt， 会 写 高 16 位 ， 于 是 在 rl 中 会 写 入 





0x0001XXXX 〈 没 有 改变 低 16 位 ) 。 最 终 ，rl 的 值 是 0x00010001。 事 实 
上 ， 任 何 时 候 在 .td 文件 中 遇 到 伪 指 令 ， 都 会 调用 它 的 扩展 函数 来 展开 伪 


TH. 


在 前 面 的 例子 中 ，mov32 立 即 数 通过 两 条 指令 来 实现 : movw R 
16 位 〉， 和 movt (高 16 位 ，。 在 .td 文件 中 SMe ERIC ATES, 如 果 需 要 发 
射 这 条 伪 指 令 ， 就 会 调用 它 的 扩 展 函 数 ， 接 着 构建 两 条 机 器 指令 
MOVLOi16 和 MOVHIi16。 这 两 条 指令 对 应 了 目标 架构 VAM ON MES 


令 。 
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e 关于 多 指令 lowering 的 详细 信息 ， 请 参见 LLVM 源 人 码 中 的 ARM 目 标 
平台 的 实现 ，]lib/Target/ARM/ARMInstrInfo.td 文 件 。 


平台 注册 


如 果 要 在 TOY 目 标 架 构 中 运行 lc 工具 ， 还 需要 把 TOY 注 册 到 1lc 工 
RR 


ERR 


DUT A TER, DAE HP Bl ES VERD: 


1. 首先 在 llvm root dir/CMakeLists.txt FJ A TOY Ja imt H: 


set(LLVM ALL TARGETS 
AArch64 
ARM 


TOY 
) 


2. 然后 在 llvm_root_dir/include/llvm/ADT/Triple.h 中 加 入 TOY 的 条 
H: 


class Triple { 
public: 
enum ArchType { 
UnknownArch, 


arm, // ARM (little endian): arm, armv.*, xscale 
armeb, // ARM (big endian): armeb 
aarch64, // AArch64 (little endian): aarch64 


toy // TOY: toy 
}; 


3. fEllvm root. dir/include/llym/MC/MCExpr.h H2 INA TOY% H: 


class MCSymbolRefExpr : public MCExpr { 
public: 
enum VariantKind { 


VK TOY LO, 
VK TOY HI, 
F3 


4. fEllvm root dir/include/llvm/Support/ELF.h"P JIILA TOY 2& H : 


enum { 
EM NONE = 0, // 非 平台 
EM M32 = 1, // AT&T WE 32100 
EM TOY = 220 // 是 下 一 个 数 

}; 


5. 然后 ， 在 lib/MC/MCExpr.cpp 中 加 入 TOY 条 目 : 


StringRef MCSymbolRefExpr::getVariantKindName(VariantKind 
Kind) { 
switch (Kind) { 


case VK TOY LO: return "TOY LO"; 
case VK TOY HI: return "TOY HI"; 


) 
6. 接着 ， 在 lib/Support/Triple.cpp 中 加 入 TOY 条 目 : 


const char *Triple::getArchTypeName(ArchType Kind) { 
switch (Kind) { 


case toy: return "toy"; 


j 


const char *Triple::getArchTypePrefix(ArchType Kind) { 
switch (Kind) { 


case toy: return "toy"; 
} 
} 
Triple: :ArchType Triple: :getArchTypeForLLVMName(StringRef 
Name) { 
.Case("toy", toy) 


static Triple::ArchType parseArch(StringRef ArchName) { 


.Case("toy", Triple::toy) 


static unsigned 
getArchPointerBitWidth(llvm::Triple::ArchType Arch) { 


case llvm::Triple::toy: 
return 32; 


Triple Triple: :get32BitArchVariant() const { 


case Triple::toy: 
// 已 经 是 32 位 
break; 


Triple Triple::get64BitArchVariant() const { 


case Triple::toy: 
T.setArch(UnknownArch) ; 
break; 


7. 在 lib/TargeVLLVMBuild.txt 中 加 入 TOY 条 目 : 


[common ] 
subdirectories = ARM AArch64 CppBackend Hexagon MSP430 ... 
TOY 


8. 在 lib/Target/TOY 目 录 下 创建 TOY.h 文 件 : 


#ifndef TARGET_TOY_H 
#define TARGET_TOY_H 


#include "MCTargetDesc/TOYMCTargetDesc.h" 
#include "llvm/Target/TargetMachine.h" 


namespace llvm { 
class TargetMachine; 
class TOYTargetMachine; 


FunctionPass *createTOYISelDag(TOYTargetMachine &TM, 
CodeGenOpt::Level OptLevel); 





) // 结束 llvm 命 名 空间 


#endif 
9. 在 lib/Target/TOY 目 录 创 建 TargetInfo 目 录 ， 在 其 中 创建 
TOYTargetInfo.cpp 文 件 : 


#include "TOY.h" 

#include "llvm/IR/Module.h" 

#include "llvm/Support/TargetRegistry.h" 
using namespace llvm; 


Target llvm::TheTOYTarget; 

extern "C" void LLVMInitializeTOYTargetInfo() { 
RegisterTarget«Triple::toy» X(TheTOYTarget, "toy", 
"TOY" ) F 


10. 在 相同 的 目录 中 创建 CMakeLists.txt 文 件 : 


add_llvm_library(LLVMTOYInfo 
TOYTargetInfo.cpp 


) 
11. G4 LLVMhBuild.txt X ff: 


[component 90] 

type - Library 

name = TOYInfo 

parent = TOY 
required_libraries = Support 
add_to_library_groups = TOY 


12. 在 lib/Target/TOY 目 录 创 建 TOYTargetMachine.cpp 文 件 : 


#include "TOYTargetMachine.h" 
#include "TOY.h" 

#include "TOYFrameLowering.h" 
#include "TOYInstrInfo.h" 
#include TOYISelLowering.h" 
#include "TOYSelectionDAGInfo.h" 
#include "llvm/CodeGen/Passes.h" 
#include "llvm/IR/Module.h" 
#include "llvm/PassManager.h" 
#include "llvm/Support/TargetRegistry.h" 
using namespace llvm; 


TOYTargetMachine::TOYTargetMachine(const Target &T, StringRef TT, 
StringRef CPU, StringRef FS, const TargetOptions &Options, 
Reloc::Model RM, CodeModel::Model CM, 
CodeGenOpt::Level OL) 
LLVMTargetMachine(T, TT, CPU, FS, Options, RM, CM, 
OL), 
Subtarget(TT, CPU, FS, *this) { 
initAsmInfo(); 


j 


namespace { 
class TOYPassConfig : public TargetPassConfig ( 


public: 
TOYPassConfig(TOYTargetMachine *TM, PassManagerBase &PM) 
: TargetPassConfig(TM, PM) {} 


TOYTargetMachine &getTOYTargetMachine() const { 
return getTM<TOYTargetMachine>(); 


j 


virtual bool addPreISel(); 
virtual bool addInstSelector(); 
virtual bool addPreEmitPass(); 


I 
) // 命名 空间 


TargetPassConfig 

*TOYTargetMachine::createPassConfig(PassManagerBase &PM) ( 
return new TOYPassConfig(this, PM); 

} 


bool TOYPassConfig::addPreISel() { return false; } 


bool TOYPassConfig::addInstSelector() { 
addPass(createTOYISelDag(getTOYTargetMachine(), 
getOptLevel())); 
return false; 


j 


bool TOYPassConfig::addPreEmitPass() { return false; } 














// 强制 静态 初始 化 
extern "C" void LLVMInitializeTOYTarget() { 
RegisterTargetMachine<TOYTargetMachine> X(TheTOYTarget); 











void TOYTargetMachine: :addAnalysisPasses(PassManagerBase 
&PM) {} 


13. 创建 一 个 新 的 目录 MCTargetDesc， 在 其 中 创建 文件 
TOYMCtTargetDesc.h: 


#ifndef TOYMCTARGETDESC_H 
#define TOYMCTARGETDESC_H 
#include "llvm/Support/DataTypes.h" 


namespace llvm { 


class Target; 

class MCInstrInfo; 
class MCRegisterInfo; 
class MCSubtargetInfo; 
class MCContext; 
class MCCodeEmitter; 
class MCAsmInfo; 
class MCCodeGenInfo; 
class MCInstPrinter; 
class MCObjectWriter; 
class MCAsmBackend; 


class StringRef; 
class raw ostream; 


extern Target TheTOYTarget; 


MCCodeEmitter *createTOYMCCodeEmitter(const MCInstrlinfo &MCII, 
const MCRegisterInfo &MRI, const MCSubtargetInfo &STI, MCContext 
&Ctx); 


MCAsmBackend *createTOYAsmBackend(const Target &T, const 
MCRegisterInfo &MRI, StringRef TT, StringRef CPU); 
MCObjectWriter *createTOYELFObjectWriter(raw ostream &OS, 
uint8 t OSABI); 





) // 结束 LLvm 命 名 空间 
#define GET REGINFO ENUM 
#include "TOYGenRegisterInfo.inc" 


Zdefine GET INSTRINFO ENUM 
#include "TOYGenInstrInfo.inc" 


Zdefine GET SUBTARGETINFO ENUM 
#include "TOYGenSubtargetInfo.inc" 


#endif 


14. 在 相同 的 目录 下 创建 TOYMCTaretDesc.cpp 文 件 : 


#include "TOYMCTargetDesc.h" 

#include "InstPrinter/TOYInstPrinter.h" 
#include "TOYMCAsmInfo.h" 

#include "llvm/MC/MCCodeGenInfo.h" 


#include "llvm/MC/MCInstrInfo.h" 

#include "llvm/MC/MCRegisterInfo.h" 
#include "llvm/MC/MCSubtargetInfo.h" 
#include "llvm/MC/MCStreamer .h" 

#include "llvm/Support/ErrorHandling.h" 
#include "llvm/Support/FormattedStream.h" 
#include "llvm/Support/TargetRegistry.h" 


#define GET INSTRINFO MC DESC 
#include "TOYGenInstrInfo.inc" 


#define GET SUBTARGETINFO MC DESC 
#include "TOYGenSubtargetInfo.inc" 
#define GET REGINFO MC DESC 

#include "TOYGenRegisterInfo.inc" 


using namespace llvm; 


static MCInstrInfo *createTOYMCInstrInfo() ( 
MCInstrinfo *X = new MCInstrInfo(); 
InitTOYMCInstrInfo(X); 
return X; 


static MCRegisterInfo *createTOYMCRegisterInfo(StringRef 
TT) { 
MCRegisterlInfo *X = new MCRegisterInfo(); 
InitTOYMCRegisterInfo(X, TOY::LR); 
return X; 


j 


static MCSubtargetInfo *createTOYMCSubtargetiInfo(StringRef 
TT, StringRef CPU, 
StringRef 
FS) { 
MCSubtargetInfo *X = new MCSubtargetInfo(); 
InitTOYMCSubtargetInfo(X, TT, CPU, FS); 
return X; 


j 


static MCAsmInfo *createTOYMCAsmInfo(const MCRegisterInfo 
&MRI, StringRef TT) ( 

MCAsmInfo *MAI = new TOYMCAsmInfo(TT); 

return MAI; 


j 


static MCCodeGenInfo *createTOYMCCodeGenInfo(StringRef TT, 
Reloc::Model RM, 
CodeModel::Model CM, 


CodeGenOpt::Level OL 


MCCodeGenInfo *X = new MCCodeGenInfo(); 
if (RM == Reloc::Default) { 

RM = Reloc::Static; 
} 


if (CM == CodeModel::Default) { 
CM = CodeModel::Small; 


if (CM != CodeModel::Small && CM != CodeModel::Large) { 
report_fatal_error("Target only supports CodeModel 
Small or Large"); 


j 


X->InitMCCodeGenInfo(RM, CM, OL); 
return X; 


Jj 


static MCInstPrinter * 
createTOYMCInstPrinter(const Target &T, unsigned 
SyntaxVariant, 
const MCAsmInfo &MAI, const 
MCInstrInfo &MII, 
const MCRegisterInfo &MRI, const 
MCSubtargetInfo &STI) ( 
return new TOYInstPrinter(MAI, MII, MRI); 


j 


static MCStreamer * 

createMCAsmStreamer(MCContext &Ctx, formatted raw ostream 

&OS, bool isVerboseAsm, bool useDwarfDirectory,MCInstPrinter 

*InstPrint, MCCodeEmitter *CE,MCAsmBackend *TAB, bool ShowInst) ( 
return createAsmStreamer(Ctx, OS, isVerboseAsm, 

useDwarfDirectory, InstPrint, CE, TAB, ShowInst); 


} 


static MCStreamer *createMCStreamer (const Target &T, 
StringRef TT, 
MCContext &Ctx, 
MCAsmBackend &MAB, 
raw ostream &OS, 
MCCodeEmitter *Emitter, 
const MCSubtargetInfo 
&STI, 
bool RelaxAll, 
bool NoExecStack) { 
return createELFStreamer(Ctx, MAB, OS, Emitter, false, 
NoExecStack); 


j 


// 强制 静态 初始 化 
extern "C" void LLVMInitializeTOYTargetMC() 007B 
// 注册 MC asm 信 息 
RegisterMCAsmInfoFn X(TheTOYTarget, createTOYMCAsmInfo); 





























// 注册 MC codegen 信 息 
TargetRegistry: :RegisterMCCodeGenInfo(TheTOYTarget, 
createTOYMCCodeGenInfo); 


// 注册 MC 指 令 信息 
TargetRegistry::RegisterMCInstrInfo(TheTOYTarget, 
createTOYMCInstrInfo); 





// 注 册 MC 寄 存 器 信息 
TargetRegistry::RegisterMCRegInfo(TheTOYTarget, 
createTOYMCRegisterInfo); 





// 注册 MC 子平 台 信息 
TargetRegistry::RegisterMCSubtargetInfo(TheTOYTarget, 
createTOYMCSubtargetInfo); 





// 注册 MCInstPrinter 

TargetRegistry: :RegisterMCInstPrinter(TheTOYTarget, 
createTOYMCInstPrinter); 

// 注册 ASM 后 端 
TargetRegistry::RegisterMCAsmBackend(TheTOYTargOO65t, 
createTOYAsmBackend); 


// 注册 assembly streamer 
TargetRegistry::RegisterAsmStreamer(TheTOYTarget, 
createMCAsmStreamer ); 


// 注册 object streamer 
TargetRegistry::RegisterMCObjectStreamer(TheTOYTarget, 
createMCStreamer); 

// 注册 MCCodeEmitter 


TargetRegistry::RegisterMCCodeEmitter(TheTOYTarget, 
createTOYMCCodeEmitter ) ; 


15. 在 相同 的 目录 中 创建 LLVMBnuild.txt 文 件 : 


[component 90] 


type = Library 

name = TOYDesc 

parent = TOY 

required_libraries = MC Support TOYAsmPrinter TOYInfo 
add_to_library_groups = TOY 


16. 创建 CMakeLists.txt 文 件 : 


add_llvm_library(LLVMTOYDesc 
TOYMCTargetDesc.cpp) 


LEER 


构建 整个 LLVM 项 目 ， 如 下 : 


$ cmake llvm src dir -DCMAKE BUILD TYPE-Release - 
DLLVM TARGETS TO BUILD="TOY" 
$ make 


这 里 我 们 指定 了 为 TOY 目 标 平台 构建 LLVM 编 译 器 ， 在 构建 完成 
后 ， 通 过 1llc 命 令 可 以 检查 LLVM 是 否 支 持 TOY 目 标 平台 : 


$ llc -version 


Registered Targets : 
toy - TOY 
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。 关于 复杂 目标 平台 的 更 多 知识 ， 例 如 流水 线 、 调 度 ， 请 参见 Chen 
Chung-Shu 和 Anoushe Jamshidi 写 的 Tutorial: Creating an LLVM 
Backend for the Cpu0 Architecture 中 的 章节 。 


[1 指令 编码 : 之 前 说 的 汇编 码 指 的 是 具有 可 读 性 的 代码 ， 但 这 种 形 
式 的 缺陷 在 于 不 够 紧凑 ， 占 据 的 空间 会 比较 大 ， 因 此 常常 还 需要 对 其 进 
行 编码 ， 得 到 更 加 紧凑 的 表示 。 这 如 同 LLVM IR 和 bitcode 的 关系 。 
译 者 注 











第 9 章 LLVM 项 目 最 佳 实践 


本 章 涵 凋 以 下 话题 : 


。LLVM 中 的 异常 处 理 

e 使 用 sanitizer 

e 使 用 LLVM 编 写 垃 圾 回收 器 
e 将 LLVM IR 转 换 为 JavaScript 
e 使 用 Clang 静 态 分 析 器 

。 使 用 bugpoint 

。 使 用 LLDB 

e 使 用 LLVM 通 用 Pass 


概述 


到 目前 为 止 ， 你 已 经 学 了 如 何 编写 编译 需 的 前 端 、 优 化 喜 以 及 后 
端 。 在 本 书 的 最 后 一 章 ， 我 们 来 看 看 LLVM 的 其 他 特性 ， 以 及 如 何在 我 
们 的 项 目 中 使 用 。 本 市 的 主要 目的 是 让 你 了 解 LLVM 中 一 些 重 要 的 工具 
Doce 它们 往往 是 LLVM 的 热点 。 因 此 ， 不 会 深入 介绍 每 一 个 主题 的 
2mm. 














LLVM 中 的 异常 处 理 


本 节 介 绍 LLVM 的 异常 处 理 机 制 。 我 们 会 讨论 LLVM IR 如 何 表示 和 
处 理 异 常 ， 以 及 LLYM 提 供 的 关于 异常 处 理 的 内 建 函 数 。 


准备 工作 


你 需要 知道 异常 处 理 是 如 何 正常 运作 的 ， 以 及 try、catch、throw 等 
一 些 概念 。 同 时 你 需要 在 PATH 安 装 Clang 和 LLVM。 


详细 步 又 


让 我 们 从 一 个 具体 的 例子 来 看 看 LLVM 中 的 异常 处 理 。 
1. 创建 一 个 文件 来 编写 源码 ， 以 测试 异常 处 理 机 制 : 





$ cat eh.cpp 
class Ex1 {}; 
void throw exception(int a, int b) ( 
Ex1 ex1; 
if (a > b) { 
throw ex1; 
} 
} 


int test_try_catch() { 
try { 
throw_exception(2, 1); 


} 
catch(...) { 
return 1; 


return 0; 


2. 使 用 以 下 命令 来 生成 bitcode 文 件 : 
$ clang -c eh.cpp -emit-llvm -o eh.bc 


3. 查看 屏幕 上 显示 的 IR， 执 行 以 下 命令 ， 输 出 如 下 : 


$ llvm-dis eh.bc -o - 

; ModuleID = 'eh.bc' 

target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128" 
target triple = "x86 64-unknown-linux-gnu" 


%Class.Ex1 = type { 18 } 


@ ZTVN10 cxxabiv117 class type infoE = external global i8* 
@_ZTS3Ex1 = linkonce odr constant [5 x i8] c"3Ex1\00" 

@_ZTI3Ex1 = linkonce odr constant { i8*, i8* } { i8* bitcast 
(18** getelementptr inbounds (i8** @ ZTVN10 cxxabivii17 class 
type infoE, i64 2) to i8*), i8* 

getelementptr inbounds ([5 x i8]* @_ZTS3Ex1, i32 0, i32 0) } 


; Function Attrs: uwtable 

define void Q Z15throw exceptionii(i32 %a, i32 %b) #0 ( 
%1 = alloca i132, align 4 
%2 = alloca i32, align 4 
%ex1 = alloca %class.Ex1, align 1 
store 132 %a, 132* %1, align 4 
store i32 %b, 132* %2, align 4 
%3 load i32* %1, align 4 
%4 = load i32* %2, align 4 
%5 icmp sgt i32 %3, %4 
br i1 %5, label %6, label %9 


; <label>:6 ; preds = %0 

%7 = call i8* @_cxa_allocate_exception(i64 1) #1 

$8 = bitcast i8* %7 to %class.Ex1* 

call void @ cxa throw(i8* %7, 18* bitcast ({ 18*, i8* }* 
@_ZTI3Ex1 to i8*), i8* null) #2 

Unreachable 


; <label>:9 ; preds = %0 
ret void 


} 


declare i8* @_cxa_allocate_exception(i64) 


declare void Q cxa throw(i8*, 18*, i8") 


; Function Attrs: uwtable 
define i32 Q Z14test try catchv() #0 ( 
%1 alloca i32, align 4 
%2 alloca i8* 
%3 alloca i32 
%4 = alloca i32 
invoke void Q Z15throw_exceptionii(i32 2, i32 1) 
to label %5 unwind label %6 


%0 


; <label>:5 ; preds 
br label %13 


; <label>:6 ; preds = %0 

%7 = landingpad { i8*, i32 } personality i8* bitcast (i32 
(...)* @ gxx personality vO to i8*) 

catch i8* null 

%8 = extractvalue { i8*, i32 } %7, 0 

store 18* %8, i8** %2 

%9 = extractvalue { i8*, i32 } %7, 1 

store i132 %9, i32* %3 

br label %10 


; <label>:10 ; preds = %6 
%11 = load i8** %2 
%12 = call i8* @ cxa begin catch(i8* %11) #1 
store i32 1, 132* %1 
store i32 1, 132* %4 
call void @_cxa_end_catch() 
br label %14 





; <label>:13 ; preds = %5 
store i32 0, 132* %1 
br label %14 
; <label>:14 
%13, %10 ; preds = 
%15 = load i32* %1 
ret i32 %15 


} 


declare i32 @_gxx_personality_v0(...) 
declare i8* @ cxa begin catch(18*) 


declare void Q cxa end catch() 





attributes #0 = { uwtable "less-precise-fpmad"="false" "no- 
frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" 


"no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack- 
protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft- 
float"="false" } 

attributes #1 = { nounwind } 

attributes #2 = { noreturn } 


!llvm.ident = !{!0} 


!0 = metadata !{metadata !"clang version 3.6.0 (220636)"} 


“CHE RS 


LLVM 是 这 样 实现 异常 的 : 当 异 常 被 抛 出 ， 运 行 时 (runtime) 会 查 
找 异 常 处 理 器 。 它 会 查找 抛 出 异常 的 那个 冰 数 对 应 的 异常 巅 ， 而 这 个 异 
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异 稼 时 如 何 处 理 。 如 果 这 门 语 言 不 文 持 异 常 处 理 ， 那 么 关于 如 何 展 开 当 
前 活动 记录 和 还 原 前 一 个 活动 记录 的 状态 的 相关 信息 则 会 在 异常 帧 中 。 


i 让 我 们 通过 之 前 的 例子 来 看 看 寞 常 处 理 在 LLVM 中 是 如 何 具 体 实 现 
A] 0 


try 区 块 在 LLVM 中 被 翻译 成 invoke 指 令 : 

















invoke void @_Z15throw_exceptionii(i32 2, i32 1) 
to label %5 unwind label %6 


Ert 083 co Ue aa PEAS JR throw_exception ex BO Hey, “EDTA 
如 何 处 理 这 个 异常 。 如 果 throw_exception 没 有 抛 出 异常 ， 正 常 执行 跳 转 
到 label %5， 人 否则 跳 转 到 label %6， 即 landing pad， 这 对 应 了 try/catch 中 
的 catch 机 制 。 如 果 程 序 执行 在 landing pad 重 新 开始 ， 它 会 接收 一 个 异常 
结构 体 ， 以 及 与 抛 出 的 异常 类 型 对 应 的 选择 器 的 值 。 这 个 选择 器 用 于 决 
定 哪 一 个 catch 函 数 来 真正 处 理 这 个 异常 。 在 本 例 中 ， 它 看 起 来 像 这 样 : 








%7 = landingpad { i8*, i32 } personality i8* bitcast (i32 (...)* 
Q  gxx personality vO to i8*) 
catch i8* null 


%7 那 一 段 代 码 描 述 了 异常 信息 。{i8*，i32} 部 分 描述 异常 类 型 ，i8* 
是 异常 指针 ， 而 i32 是 异常 选择 器 的 值 。 在 这 里 我 们 只 有 一 个 选择 器 的 
值 ， 所 以 catch 函 数 会 接受 所 有 抛 出 类 型 的 异常 。@__gxx_personality_v0 
K Zi E personality K žr, "E Bez E PX (context) ， 即 一 个 包含 
异常 对 象 类 型 和 值 的 异常 结构 体 ， 以 及 一 个 当前 函数 异常 表 的 引用 。 当 
前 编译 单元 的 personality 函 数 在 公共 异常 帧 指定 。 本 例 中 ， 
(2 ”gxx_personality_v0 函 数 则 表示 我 们 在 处 理 C++ 异 常 。 


所 以 %8 = extractvalue { i8*, i32 } %7, 0 表示 异常 对 象 ， 而 %9 = 
extractvalue { i8*, i32 ) 967, 1 则 表示 选择 器 值 。 


下 面 是 一 些 值得 注意 的 代 函 数 。 





e _ cxa thorw: 用 于 抛 出 异常 的 函数 。 

e _cxa_begin_catch: 接受 一 个 异常 结构 体 的 引用 作为 参数 ， 返 回 异 
ToS RB o 

e  cxa end catch: 处 理 最 近 捕 捉 的 异常 ， 减 少 handler 计 数 ， 如 果 计 
数 为 0 则 停止 异常 捕捉 。 
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e XTLLVMIB WI, Sl http://IIvm.org/docs/ExceptionHand- 
ling.html#llvm-code-generation. 


fi FA sanitizer 


如 果 你 有 过 内 存 调 试 的 经 验 ， 那 么 你 应 该 用 过 Valgrind 这 样 的 工 
具 。 同 样 ，LLVM 也 提供 了 内 存 调 试 的 工具 ， 例 如 地 址 sanitizer、 内 存 
sanitizer 等 。 这 些 工 具 虽 然 没 有 Valgrind 那 么 成 熟 ， 但 是 相 比 之 下 速度 更 
快 。 这 些 工 具 大 部 分 都 还 在 开发 实验 阶段 ， 所 以 你 也 可 以 参与 这 些 开 源 
软件 的 开发 。 


准备 工作 


如 果 要 使 用 sanitizer， 需 要 从 LLVM SVN 把 compiler-rt 的 代码 检 出 下 
X: 





cd llvm/projects 
svn CO http://llvm.org/svn/llvm-project/compiler - 
rt/trunk compiler-rt 


如 第 1 章 “LLVM 设 计 与 使 用 ”所 描述 的 ， 重 新 构建 LLVM， 这 样 我 们 
就 能 获得 所 需 的 运行 时 库 了 。 


详细 步 又 


执行 以 下 步 又， 测试 地 址 sanitizer。 
1. 编写 测试 实例 ， 检 查 地 址 sanitizer: 





$ cat asan.c 

int main() { 

int a[5]; 

int index = 6; 

int retval = a[index]; 
return retval; 


2. 使 用 fsanitize=address 命 令 行 参数 编译 测试 代码 ， 以 使 用 地 址 


sanitizer: 


$ clang -fsanitize=address asan.c 


3. 使 用 以 下 命令 执行 地 址 sanitizer: 


$ ASAN SYMBOLIZER PATH-/usr/local/bin/llvm-symbolizer ./a.out 


输出 如 下 : 


CER 


LLVM 地 址 sanitizer 的 工作 原理 是 将 代码 仪表 化 。 这 个 工具 由 编译 
器 仪表 化 模块 和 运行 时 库 组 成 。 代 但 仪表 化 部 分 的 工作 由 LLVM Pass 完 
成 ， 由 命令 行 参数 fsanitize= address 唤 起 ， 检 碍 每 一 条 指令 ， 之 前 的 例子 
己 经 展示 。 而 运行 时 库 则 把 代码 中 的 malloc 和 free 函 数 蔡 换 为 自 定 义 的 
代码 。 在 我 们 进一步 讨论 如 何 进行 代码 仪表 化 之 前 ， 我 们 先 来 看 看 虚拟 
地 址 空间 如 何 分 为 两 个 独立 的 类 : 一 块 是 主 应 用 内 存 ， 由 常规 的 应 用 代 
码 使 用 ， 另 一 块 是 shadow 内 存 ， 包 含 shadow 值 “元 数据 ) 。 


shadow 内 存 和 主 应 用 内 存 是 相互 关联 的 ， 使 用 主 内 存 中 的 一 个 地 址 
意味 着 相应 地 在 shadow 内 存 写 入 一 个 特殊 值 。 


让 我 们 回 到 地 址 sanitizer，malloc 函 数 分 配 的 地 址 我 们 称 之 为 污染 过 
的 ， 而 free 函 数 释 放 的 地 址 会 放 在 隔离 区 ， 也 是 污染 过 的 。 程 序 中 每 一 
个 内 存 访 问 会 被 编译 器 进行 如 下 转换 。 


首先 ， 地 址 像 这 样 : 











*address = ...; 
在 转换 之 后 ， 变 成 : 
if (IsPoisoned(address)) { 
ReportError(address, kAccessSize, kIsWrite); 


*address = ...; 
这 意味 着 ， 如 果 存 在 非法 访问 内 存 ， 就 会 报错 。 


在 前 面 的 例子 中 ， 我 们 为 缓冲 区 洲 出 写 了 一 段 代 码 ， 发 生 数 组 访问 
越界 了 。 这 里 ， 数 组 前 后 的 地 址 都 进行 了 代码 仪表 化 的 工作 。 当 试图 访 
问 数 组 上 界 之 外 的 内 容 时 ， 即 访问 红色 区 域 ， 地 址 sanitizer 就 会 报告 


stack buffer overflow 错 误 。 
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e 关于 地 址 sanitizer 的 文档 ， 请 参见 http://clang.llvm.org/docs/Address- 
Sanitizer.html. 

e 关于 LLVM 中 使 用 的 其 他 sanitizer， 请 参见 : 
http://clang.llvm.org/docs/MemorySanitizer.html 
http://clang.llvm.org/docs/ThreadSanitizer.html 
https://code.google.com/p/address-sanitizer/wiki/LeakSanitizer 


fit HHLLVM2n 53 Er DR [n HNC 


垃圾 回收 (Garbage collection) 是 一 种 由 垃圾 回收 器 (Garbage 
Collector) 自动 回收 不 再 使 用 的 对 象 内 存 的 内 存 管理 技术 ， 这 减 小 了 程 
序 员 记 录 堆 区 对 象 生命 周期 的 压力 。 

本 市 介绍 如 何 把 LLVM 整 合 到 一 个 支持 垃圾 回收 的 语言 中 去 。 
LLVM 自 身 不 提供 垃圾 回收 器 ， 但 是 提供 了 一 个 描述 垃圾 回收 绒 的 框 
架 ， 以 便于 程序 员 编 号 自己 的 垃圾 回收 器 。 


准备 工作 
必须 构建 和 安装 LLVM。 
VY Te 
详细 步 又 
下 面 展 示 包 含 垃 圾 回收 内 建 函 数 的 LLVM IR 代 码 如 何 转 到 相应 的 机 


ard Fat CAS o 
1. 编写 测试 代码 : 

















$ cat testgc.11 


declare i8* @llvm_gc_allocate(i32) 
declare void Qllvm gc initialize(i32) 


declare void Qllvm.gcroot(i8**, i8*) 
declare void Qllvm.gcwrite(i8*, i8*, i8**) 


define i32 @main() gc "shadow-stack" { 
entry: 

%A = alloca i8* 

%B = alloca i8** 


call void @llvm_gc_initialize(i32 1048576) ; Start with 1MB hea 


;; void *A; 
call void @llvm.gcroot(i8** %A, i8* null) 


;; A = gcalloc(10); 
%Aptr = call i8* @llvm_gc_allocate(i32 10) 
store i8* %Aptr, i8** %A 


;; void **B; 
%tmp.1 = bitcast i8*** XB to i8** 
call void Qllvm.gcroot(i8** %tmp.1, i8* null) 


;; B = gcalloc(4); 

9B.upgrd.1 = call i8* Qllvm gc allocate(i32 8) 

%tmp.2 = bitcast i8* %B.upgrd.1 to i8** 

store i8** %tmp.2, i8*** %B 

;; *B = A; 

%B.1 load i8**, ji8*** %B 

%A.1 load i8*, i8** %A 

call void @llvm.gcwrite(i8* %A.1, i8* %B.upgrd.1, i8** %B.1) 


br label %AllocLoop 


AllocLoop: 


%i = phi i32 [ 0, %entry ], [ %indvar.next, %AllocLoop ] 
;; Allocated mem: allocated memory is immediately dead. 
call i8* @llvm_gc_allocate(i32 100) 


%indvar.next = add i32 %i, 1 
%exitcond = icmp eq i32 %indvar.next, 10000000 
br i1 %exitcond, label %Exit, label %AllocLoop 


Exit: 


ret i32 0 


declare void Q  main() 


2. 使 用 llc 工 具 生 成 汇编 码 ， 并 使 用 cat 命 令 查 看 汇编 码 : 


$ llc testgc.11 


$ cat testgc.s 


. text 


.file "testgc.11" 
.globl main 
.align 16, 0x90 
.type main, @function 
main: # @main 
.Lfunc beginO: 
.cfi_startproc 
.cfi_personality 3, _ gcc personality vO 
.cfi_lsda 3, .LexceptionO 
4 BB#0: # «entry 
pushq %rbx 
.Ltmp9: 
.Cfi def cfa offset 16 
subq $32, %rsp 
.Ltmp10: 
.cfi_def_cfa_offset 48 
.Ltmp11: 
.cfi_offset %rbx, -16 
movq llvm_gc_root_chain(%rip), %rax 
movq $ gc main, 8(%rsp) 
movq $0, 16(%rsp) 
movq %rax, (%rsp) 
leaq (%rsp), %rax 
movq %rax, llvm_gc_root_chain(%rip) 
movq $0, 24(%rsp) 


.Ltmpo: 
movl $1048576, %edi # imm = 0x100000 
callq llvm_gc_initialize 

.Ltmpi: 

4 BB#1: # %entry .cont3 

.Ltmp2: 


movl $10, %edi 
callq llvm gc allocate 


.Ltmp3: 

4 BBZ2: # 9entry.cont2 
movq %rax, 16(%rsp) 

.Ltmp4: 


movl $8, %edi 
callq llvm gc a 
.Ltmpb5: 
4 BBZ3: # 9entry.cont 
movq %rax, 24(%rsp) 
movq 16(%rsp), %rcx 
movq %rcx, (%rax) 
movl $10000000, %ebx # imm = 0x989680 
.align 16, 0x90 
.LBBO 4: 4 %AllocLoop 
# -»This Inner Loop 


Header: Depth=1 
.Ltmp6: 
movl $100, %edi 
callq llvm gc allocate 


.Ltmp7: 
# BB#5: # %AllocLoop.cont 
# in Loop: Header=BB0_4 
Depth=1 
decl %ebx 
jne .LBBO_4 
# BB#6: # %EXit 


movq (%rsp), %rax 
movq %rax, llvm_gc_root_chain(%rip) 
xorl %eax, %eax 
addq $32, %rsp 
popq %rbx 
retq 
. LBBO_7: # %gc_cleanup 
.Ltmp8: 
movq (%rsp), 9?ercx 
movq %rcx, llvm gc root chain(%rip) 
movq %rax, %rdi 
callq _Unwind_Resume 
. Lfunc_endo: 
.Size main, .Lfunc end0O-main 
.cfi endproc 
.section .gcc except table, "a",Qprogbits 


.align 4 
GCC except tableO: 
.LexceptionO: 
.byte 255 4 QLPStart Encoding - omit 
.byte 3 4 QTType Encoding - udata4 
.asciz "\234" 4 @TType base offset 
.byte 3 4 Call site Encoding = udata4 
.byte 26 4 Call site table length 
.long .Ltmp0-.Lfunc beginO # >> Call Site 1 << 
.long .Ltmp7-.LtmpO 4 Call between .LtmpO and 
.Ltmp7 
.long .Ltmp8-.Lfunc beginO # jumps to .Ltmp8 
.byte 0 # On action: cleanup 
.long .Ltmp7-.Lfunc beginO # >> Call Site 2 << 
.long .Lfunc end0-.Ltmp7 # Call between .Ltmp7 and 
. Lfunc_endo 
.long 0 # has no landing pad 
.byte 0 # On action: cleanup 
.align 4 


.type llvm gc root chain,Qobject 4 Qllvm gc root chain 


.bss 
.Weak llvm gc root chain 
.align 8 
llvm gc root chain: 
.quad 0 
.SIZe llvm gc root chain, 8 


.type . gc main,Qobject 4 Q0 gc main 
.section .rodata, "a",Qprogbits 
.align 8 
. gc main: 
.long 2 # 0x2 
.long 0 # 0x0 


.size X gc main, 8 


.section ".note.GNU-stack","",@progbits 


LR ERR 


前 面 例子 的 主 函 数 中 ， 我 们 使 用 了 内 建 的 垃圾 回收 器 策略 shadow- 
stack， 它 会 维护 栈 roots() 的 链接 列表 : 


define i32 @main() gc "shadow-stack" 


它 镜 像 了 机 器 栈 。 我 们 可 以 提供 其 他 的 垃圾 回收 技术 ， 只 需要 在 函 
数 名 后 面 指定 gc 策略 的 名 字 ， 例如 gc"strategy name"， 策 略 名 字 可 以 是 
内 建 的 策略 ， 也 可 以 是 自己 定义 的 垃圾 回收 策略 。 


为 了 发 现 GC root， 也 就 是 堆 区 对 象 的 指针 ，LLVM 使 用 了 内 建 函 数 
@llvm.gcroot， 或 者 .statepoint 重 定位 序列 。llvm.gcroot 内 建 函 数 通 知 
LLVM 这 是 一 个 栈 上 变量 对 堆 区 对 象 的 引用 ， 垃 圾 回收 器 需要 跟踪 这 个 
堆 区 对 象 。 下 面 的 代码 就 是 调用 llvm.gcroot 函 数 来 标记 %tmp.1 栈 变量 : 


call void @llvm.gcroot(i8** %tmp.1, i8* null) 





llvm.gcwrite 函 数 则 是 写 屏障 (write barrier) ， 这 意味 着 使 用 了 垃圾 
回收 的 程序 把 一 个 指针 写 到 推 区 对 象 的 字段 中 ， 因 此 会 通知 垃圾 回收 
器 。 于 此 相似 的 是 llvm.gcread，llvm.gcread 内 建 函 数 表 示 程 序 从 堆 区 对 
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写 入 %B.upgrd 堆 区 对 象 。 


Call void Qllvm.gcwrite(i8* %A.1, i8* %B.upgrd.1, i8** %b.1) 
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的 一 部 分 。 之 前 的 例子 展示 了 LLVM 为 描述 垃圾 回收 器 提供 的 必要 
TH. 
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e 关于 垃圾 回收 的 详细 信息 ， 请 参见 
http://llvm.org/docs/GarbageCollection.html. 
e 天 于 其 他 的 垃圾 回收 方法 ， 请 参见 
http://Ilvm.org/docs/Statepoints.html. 


将 LLVM IR}; i 7j JavaScript 


本 节 将 简要 讨论 如 何 把 LLVM IRE AJavaScript. 
vp 
准备 工作 

执行 以 下 步 又， 把 LLVM IR 转 为 JavaScript。 

1. 我 们 使 用 emscripten 工 具 把 LLVM IR 转 为 JavaScript。 你 需要 先 从 
https://kripken.github.io/emscripten-site/docs/getting started/down 
loads.html 下 载 SDK， 或 者 也 可 以 从 源码 构建 ， 但 仅仅 为 了 实验 ， 推 荐 使 
用 工具 链 中 的 SDK。 

2. 在 下 载 SDK 之 后 ， 请 解压 并 切换 到 其 根 目录 。 

3. 安装 default-jre、nodejs、cmake、build-essential、git 依 赖 。 

4. 执行 以 下 命令 安装 SDK: 

./emsdk update 


./emsdk install latest 
./emsdk activate latest 


5. ”执行 ./emscripten 脚 本 检查 是 否 有 正确 的 值 ， 否 则 进行 相应 的 更 
新 。 





详细 步骤 
执行 以 下 步骤。 


1. 编写 测试 代码 ， 以 进行 从 了 到 JavaScript 的 转换 : 


$ cat test.c 
#include<stdio.h> 


int main() { 
printf("hi, user!\n"); 
return 0; 


} 
2. 把 代码 转换 为 LLVM IR: 


$ clang -S -emit-llvm test.c 


3. 执行 emsdk_portable/emscripten/master 目 录 的 emcc 把 .1 文件 当 作 输 
入 并 转 为 JavaScript: 


$ ./emcc test.11 


4. 输出 文件 是 a.outjs 文 件 ， 用 以 下 命令 执行 这 个 文件 : 


$ nodejs a.out.js 
hi, user! 
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e HZ, WA Whttps://github.com/kripken/emscripten. 
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本 节 介 绍 通过 Clang 静 态 分析 器 对 代码 进行 静态 分 析 。 它 基于 Clang 
和 LLVM 构 建 ， 它 使 用 的 静态 分 析 引 擎 是 一 个 Clang 库 ， 因 此 具有 较 高 
的 可 重用 性 ， 并 能 够 在 不 同 的 客户 端 中 使 用 。 


8 我 们 会 以 除 零 错误 为 例 ， 展 示 Clang 静 态 分 析 器 如 何 处 理 这 个 错 
Vo 


准备 工作 


你 需要 构建 并 安装 LLVM 和 Clang。 


详细 步骤 
执行 以 下 步骤。 


1. 创建 测试 文件 ， 编 写 以 下 测试 代码 : 


$ cat sa.c 
int func() { 
int a = 0; 
int b = 1/a; 
return b; 


} 


2. WU Rare {Te RIS 11 Clangitas ait as, TEBE SI 
输出 : 


$ clang -cc1 -analyze -analyzer-checker=core.DivideZero sa.c 
sa.c:3:10: warning: Division by zero 
int b - 1/a; 


一 八 一 
1 warning generated. 


CHER 


程序 会 被 静态 分 析 器 核心 象征 性 地 执行 ， 程 序 的 输入 值 都 是 象征 性 
的 组 。 表 达 式 的 值 也 是 基于 输入 的 符号 和 路 径 计 算 的 。 代 码 的 执行 是 与 
路 径 相关 的 ， 因 此 每 一 条 可 能 路 径 痢 会 被 分 析 。 


执行 的 时 候 ， 执 行 轨迹 由 爆炸 图 Cexploded graph) 来 表示 ， 每 一 个 
ExplodedGraph 上 的 节点 称 为 ExplodedNode， 它 由 一 个 ProgramState 对 象 
(表示 程序 的 抽象 状态 ) ， 以 及 一 个 ProgramPoint 对 象 〈 表 示 程 序 的 相 
应 地 址 ) ， 所 组 成 。 


对 于 每 一 种 类 型 的 bug， 都 有 一 个 对 应 的 checker。 在 构建 
ProgramState 的 时 候 ， 每 个 checker 都 会 链接 到 分 析 器 的 核心 。 每 次 分 析 
引擎 探测 一 个 新 的 语句 的 时 候 ， 它 会 通知 每 一 个 注册 的 checker 去 监听 这 
个 语句 ， 给 它 报告 bug 或 者 修改 语句 的 机 会 。 


每 一 个 checker 则 会 注册 不 同 的 事件 和 回调 函数 ， 例 如 PreCall《〈 在 函 
数 调用 之 前 ) ，DeadSymbols (符号 失效 ) 等 。 不 同 的 事件 会 通知 不 同 
的 checker， 它 们 也 会 执行 不 同 的 动作 。 


本 节 我 们 使 用 了 除 零 checker， 它 会 报告 除 零 的 错误 。 这 个 checker 
注册 了 PreStmt 回 调 ， 在 语句 执行 之 前 调用 。 检 查 下 一 条 语句 的 运算 
符 ， 如 果 是 除法 运算 符 ， 则 检查 除数 是 否 为 0， 如 果 找 到 可 能 的 值 则 报 
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e 关于 静态 分 析 器 和 checker 的 更 多 实现 细节 ， 请 参见 http://clang- 
analyzer.llvm.org/checker_dev_manual.html。 


使 用 bugpoint 


本 节 介 绍 LLVM 提 供 的 一 个 有 用 的 工具 一 一 bugpoint。bugpoint 人 允许 
我 们 减 小 LLVM 工 具 和 Pass 的 问题 规模 ， 在 调试 优化 器 般 涡 、 优 化 器 误 
编译 、 坏 的 本 地 代码 生成 方面 会 很 有 效 。 通 过 它 ， 我 们 可 以 缩小 问题 的 
规模 ， 在 一 个 较 小 的 测试 用 例 下 进行 研究 。 


准备 工作 


你 需要 构建 安装 LLVM。 








详细 步骤 
执行 以 下 步骤。 


1. 编写 bugpoint 工 具 的 测试 用 例 : 


$ cat crash-narrowfunctiontest.11 
define i32 Qfoo() { ret i32 1 } 


define i32 @test() { 
call i32 Qtest() 
ret 132 %1 


} 
define i32 @bar() { ret i32 2 } 


2. 在 测试 用 例 中 使 用 bugpoint 来 查看 结 


$ bugpoint -load path-to-llvm/build/./lib/BugpointPasses. so 
crash-narrowfunctiontest.11 -output-prefix 
crash-narrowfunctiontest.ll.tmp -bugpoint-crashcalls -silence- 
passes 


Read input file : 'crash-narrowfunctiontest.11' 

*** All input ok 

Running selected passes on program to test for crash: Crashed: Ab 
(core dumped) 

Dumped core 


*** Debugging optimizer crash! 

Checking to see if these passes crash: -bugpoint - 
crashcalls: Crashed: 

Aborted (core dumped) 

Dumped core 


*** Found crashing pass: -bugpoint-crashcalls 

Emitted bitcode to 'crash-narrowfunctiontest.11.tmp-passes.bc' 
*** You can reproduce the problem with: opt 
crash-narrowfunctiontest.11.tmp-passes.bc -load 
/home/mayur/LLVMSVN REV/ llvm/llvm/rbuild/./lib/BugpointPasses.so 
-bugpoint-crashcalls 


*** Attempting to reduce the number of functions in the testcase 
Checking for crash with only these functions: foo test bar: Crash 
Aborted (core dumped) 

Dumped core 

Checking for crash with only these functions: foo test: Crashed: . 
(core dumped) 

Dumped core 

Checking for crash with only these functions: test: Crashed: Abor 
dumped) 

Dumped core 

Emitted bitcode to 
'crash-narrowfunctiontest.ll.tmp-reduced-function.bc' 


*** You can reproduce the problem with: opt 
crash-narrowfunctiontest.ll.tmp-reduced-function.bc - 
load /home/mayur/ 

LLVMSVN REV/llvm/llvm/rbuild/./lib/BugpointPasses.so 
-bugpoint-crashcalls 

Checking for crash with only these blocks: : Crashed: Aborted (co 
Dumped core 

Emitted bitcode to 'crash-narrowfunctiontest.ll.tmp-reduced- 
blocks.bc' 


*** You can reproduce the problem with: opt 
crash-narrowfunctiontest.11.tmp-reduced-blocks.bc - 
load /home/mayur/ 

LLVMSVN REV/llvm/llvm/rbuild/./lib/BugpointPasses.so 
-bugpoint-crashcalls 

Checking for crash with only 1 instruction: Crashed: Aborted (cor 


Dumped core 


*** Attempting to reduce testcase by deleting instructions: 
Simplification Level #1 
Checking instruction: %1 = call i32 @test()Success! 


*** Attempting to reduce testcase by deleting instructions: 
Simplification Level #0 
Checking instruction: %1 = call i32 @test()Success! 


*** Attempting to perform final cleanups: Crashed: Aborted (core 
Dumped core 

Emitted bitcode to 
"crash-narrowfunctiontest.11.tmp-reduced-simplified.bc' 


*** You can reproduce the problem with: opt 
crash-narrowfunctiontest.ll.tmp-reduced-simplified.bc -load 
/home/mayur/LLVMSVN REV/llvm/llvm/rbuild/./lib/BugpointPasses.so 
-bugpoint-crashcalls 


3. 为 了 查看 简化 过 的 测试 用 例 ， 使 用 llvm-dis 命 令 把 crash- 
narrowfunction- test.ll.tmp-reduced-simplified.bc 文 件 转 为 .1 形式， 然后 查 
看 缩小 的 测试 用 例 : 


$ llvm-dis crash-narrowfunctiontest.ll.tmp-reduced-simplified.bc 
$ cat $ cat crash-narrowfunctiontest.11.tmp-reduced-simplified.11 
define void Qtest() { 

call void Qtest() 

ret void 


} 
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bugpoint E. Z7 JU EFE ST PA ATA Pass, WRA Pass Hi lit 
了 ， 那 么 就 会 调用 朋 溃 调试 器 。 朋 省 调 试 器 会 答 试 简化 导致 朋 训 的 Pass 
列表 ， 减 少 不 必 要 的 函数 ， 删 除 控制 流 图 上 的 边 ， 甚 至 会 把 测试 程序 缩 
减 到 一 个 函数 。 之 后 ， 它 会 删除 与 骨 泪 无 关 的 LLVM 指 令 。 最 后 ， 它 简 
洁 明 了 地 指出 了 导致 月 溃 的 Pass， 以 及 已 简化 过 的 测试 用 例 。 


如 果 没 有 指定 -output 选 项 ，bugpoint 会 在 一 个 "safe" 一 代 的 后 端 运行 


程序 并 得 到 参考 输出 ， 然 后 比较 这 里 的 输出 和 选 定 的 代码 生成 器 的 输 
Ho WREED RMH EAHA RA REZIN MRAR 
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最 后 ， 如 果 代 码 生 成 器 的 输出 和 参考 输出 相同 ，bugpoint 会 运行 所 
有 的 LLVM Pass 并 对 照 参考 输出 来 检查 输出 。 如 果 有 任何 的 不 匹配 ， 就 
会 启动 错误 编译 调试 器 。 这 个 错误 编译 调试 器 在 工作 的 时 候 会 把 测试 程 
序 分 成 两 块 ， 在 一 块 运行 优化 ， 然 后 把 两 块 链接 到 一 起 得 到 结果 。 它 尝 
试 把 问题 减 小 到 导致 错误 编译 的 那个 Pass， 然 后 精确 指出 错误 的 测试 程 
序 的 位 置 。 最 后 输出 简化 过 的 导致 错误 编译 的 用 例 。 


在 之 前 的 测试 用 例 中 ，bugpoint 会 检查 所 有 函数 的 骨 尝 情况 ， 最 终 
定位 到 错误 出 在 测试 函数 中 。 它 也 会 尝试 简化 函数 中 的 指令 。 在 检查 过 
程 中 ， 每 一 阶段 的 输出 都 会 以 目 说 明 的 方式 显示 在 终端 上 。 最 后 ， 产 生 
一 个 简化 的 bitcode 格 式 的 测试 用 例 ， 我 们 能 把 它 转 为 LLVM IR 来 获得 简 
化 的 测试 用 例 。 
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e 关于 bugpoint 的 更 多 信息 ， 请 参见 
http://Ilvm.org/docs/Bugpoint.html. 


使 用 LLDB 


本 节 介 绍 LLVM 提 供 的 调试 工具 LLDB。LLDB 是 新 一 代 的 高 性 
能 调试 器 ， 由 高 可 重用 性 的 一 系列 组 件 构成 ， 对 于 大 型 LLVM 项 目 中 的 
现存 库 是 有 优势 的 。 事 实 上 ， 你 会 发 现 它 和 gdb 调 试 工具 非常 相似 。 


准备 工作 


在 使 用 LLDB 之 前 需要 以 下 两 步 。 


1. 为 了 使 用 LLDB， 先 在 llvm/tods 目 录 下 查看 LLDB 的 源码 : 














svn co http://llvm.org/svn/llvm-project/lldb/trunk lldb 


2. 构建 和 安装 LLVM， 同 时 会 构建 LLDB。 


详细 步骤 
执行 以 下 步骤。 


1. 为 使 用 LLDB 编 写 一 个 简单 的 测试 用 例 : 


$ cat lldbexample.c 
#include<stdio.h> 
int globalvar = 0; 


int func2(int a, int b) { 
globalvar++; 
return a*b; 


} 


int func1(int a, int b) { 


globalvar++; 
int d = a + b; 
int e =a - b; 


int f func2(d, e); 
return f; 

} 

int main() { 
globalvar++; 

int a = 5; 

int b = 3; 


int c = funci(a,b); 
printf ("%d", c); 
return C; 


} 





2. 使 用 -g 参 数 调 用 Clang 编 译 代码 ， 可 以 产生 调试 信息 : 


$ clang -g lldbexample.c 


3. 使 用 LLDB 调 试 之 前 文件 生成 的 输出 文件 ， 把 文件 名 传递 给 


LLDB， 以 加 载 输出 文件 : 


$ lldb a.out 
(lldb) target create "a.out" 
Current executable set to 'a.out' (x86_64). 


4. 在 主 函 数 设置 断 点 : 


(lldb) breakpoint set --name main 
Breakpoint 1: where = a.out'main + 15 at lldbexample.c:20, 
address = 0x00000000004005bf 


5. 使 用 以 下 命令 但 看 断 点 集合 的 列表 : 





(lldb) breakpoint list 
Current breakpoints: 
1: name = 'main', locations = 1 


1.1: where = a.out'main + 15 at lldbexample.c:20, address 


a.out[0x00000000004005bf], unresolved, hit count = 0 


6. 设置 在 命中 断 点 时 执行 的 命令 。 这 里 设置 在 命中 主 函 数 中 的 断 点 
时 执行 回溯 ，bt 命 令 : 


(lldb) breakpoint command add 1.1 

Enter your debugger command(s). Type 'DONE' to end. 
> bt 

> DONE 


7. 使 用 以 下 命令 执行 文件 ， 它 会 触发 在 main 函 数 的 断 点 ， 然 后 执行 
回溯 (bt) 命令 ， 正 如 前 一 步 所 设置 的 : 


(lldb) process launch 

Process 2999 launched: '/home/mayur/book/chap9/a.out' (x86 64) 

Process 2999 stopped 

* thread #1: tid = 2999, 0x00000000004005bf a.out'main + 15 at 

lldbexample.c:20, name = 'a.out', stop reason = breakpoint 1.1 
frame #0: 0x00000000004005bf a.out'main + 15 at 

lldbexample.c:20 


17 
18 
19 int main() { 
-> 20 globalvar--*; 
21 int a = 5; 
22 int b = 3; 
23 
(1ldb) bt 
* thread #1: tid = 2999, 0x00000000004005bf a.out'main + 15 at 
lldbexample.c:20, name = 'a.out', stop reason = breakpoint 1.1 


* frame #0: 0x00000000004005bf a.out'main + 15 at 
lldbexample.c:20 
frame #1: 0x00007ffff7a35ecb5 libc.so.6' libc start _ 
main(main=0x00000000004005b0, argc-1, argv-0x00007fffffffda18, 
init-«unavailable», fini=<unavailable>, rtld fini-«unavailable», 
stack endz0x00007fffffffda08) + 245 at libc-start.c:287 
frame #2: 0x0000000000400469 a.out</b> 


8. 使 用 以 下 命令 ， 在 全 局 变量 设置 watchpoint: 


(lldb) watch set var globalvar 
Watchpoint created: Watchpoint 1: addr = 0x00601044 size = 4 stat 
enabled type = w 

declare @ '/home/mayur/book/chap9/lldbexample.c:2' 

watchpoint spec = 'globalvar' 


new value: 0 


9. 设置 当 globalvar 的 值 为 3 的 时 候 停止 执行 ， 使 用 watch 命 令 : 


(lldb) watch modify -c '(globalvar==3) ' 

To view list of all watch points: 

(lldb) watch list 

Number of supported hardware watchpoints: 4 

Current watchpoints: 

Watchpoint 1: addr - 0x00601044 size - 4 state - enabled type - w 
declare Q '/home/mayur/book/chap9/lldbexample.c:2' 


watchpoint spec - 'globalvar' 
new value: 0 
condition = '(globalvar==3) ' 


10. 使 用 以 下 命令 在 主 函 数 之 后 继续 执行 。 遇 到 globalvar 的 值 变 为 3 
WIS o ZIE, EA func? Až: 


(lldb) thread step-over 

(lldb) Process 2999 stopped 

* thread #1: tid = 2999, 0x000000000040054b a.out'func2(a=8, b=2) 

at lldbexample.c:6, name = 'a.out', stop reason = watchpoint 1 
frame #0: 0x000000000040054b a.out'func2(a=8, b=2) + 27 at 

lldbexample.c:6 


3 
4 int func2(int a, int b) { 
5 globalvar--*; 
-> 6 return a*b; 
7 } 
8 
9 


Watchpoint 1 hit: 
old value: 0 
new value: 3 


(lldb) bt 
* thread #1: tid = 2999, 0x000000000040054b a.out'func2(a-8, b-2) 
at lldbexample.c:6, name = 'a.out', stop reason = watchpoint 1 


* frame #0: 0x000000000040054b a.out'func2(a-8, b=2) + 27 at 
lldbexample.c:6 
frame #1: 0x000000000040059c a.out'funci(a=5, b=3) + 60 at 
lldbexample.c:14 
frame #2: 0x00000000004005e9 a.out'main + 57 at lldbexample.c 
frame #3: 0x00007ffff7a35ec5 libc.so.6' libc start 


main(main=0x00000000004005b0, argc=1, argv-0x00007fffffffda18, 
init=<unavailable>, fini=<unavailable>, rtld_fini=<unavailable>, 
stack end-z0x00007fffffffda08) + 245 at libc-start.c:287 

frame #4: 0x0000000000400469 a.out 


11. 使 用 thread continue 命 令 继续 执行 ， 如 果 没 有 遇 到 断 点 的 话 ， 会 
执行 到 结束 : 


(lldb) thread continue 

Resuming thread 0x0bb7 in process 2999 

Process 2999 resuming 

Process 2999 exited with status = 16 (0x00000010) 


12. 使 用 以 下 命令 退出 LLDB: 


(lldb) exit 
LI N 
BEA A 


。 关于 LLDB 命 令 的 详细 列表 ， 请 参见 
http://ldb.llvm.org/tutorial.html . 


使 用 LLVM 通 用 Pass 


本 节 介 绍 LLVM 的 通用 Pass。 如 同名 字 所 暗示 的 ， 它 们 是 提供 给 用 
户 帮助 理解 LLVM 特 定 组 件 的 一 些 通 用 工具 ， 通 常 来 说 ， 直 接 查 看 代码 
来 理解 这 些 组 件 会 非常 困难 。 本 节 会 介绍 两 个 展示 程序 控制 流 图 的 通用 


准备 工作 


你 需要 构建 和 安装 LLVM， 并 安装 graphviz 工 具 ， 可 以 选择 从 
http://www.graphviz.org/Download.php 下 载 graphviz， 或 者 如 果 你 机 器 的 
可 用 包 列 表 中 有 这 个 工具 ， 也 可 以 从 包 管 理 器 进行 安装 。 











详细 步骤 
执行 以 下 步骤。 


1. 为 运行 通用 Pass 编 写 测 试 代码 ， 测 试 代码 包含 if 块 ， 会 在 控制 流 
图 中 创建 一 个 新 的 边 : 


$ cat Utility.11 
declare double Qfoo() 


declare double @bar() 


define double @baz(double %x) { 

entry: 
%ifcond = fcmp one double %x, 0.000000e+00 
br i1 %ifcond, label %then, label %else 


then: ; preds = %entry 
%calltmp = call double Qfoo() 
br label %ifcont 


else: ; preds = %entry 
%calltmp1 = call double @bar() 
br label %ifcont 


ifcont: ; preds = %else, %then 
%iftmp = phi double [ %calltmp, %then ], [ %calltmp1, %else ] 
ret double %iftmp 

} 


2. 运行 view-cfg-onlyPass， 碍 看 函数 的 控制 流 图 ， 不 包括 函数 体 : 


$ opt -view-cfg-only utility.11 


3. 使 用 graphviz 工 具 查 看 dot 文 件 : 


4. 运行 view-domPass 查 看 水 数 的 支配 者 树 : 


$ opt -view-dom utility.11 


5. 使 用 graphviz 工 具 碍 看 dot 文 件 : 


HWZ p] 


e 关于 其 他 可 用 的 工具 Pass， 请 参见 
http://Ilvm.org/docs/Passes.html#utility-passes 。 
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